Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise...

66
Diagnóstico no modelo de regressão logística ordinal Marina Calais de Freitas Moura D ISSERTAÇÃO DE MESTRADO I NSTITUTO DE MATEMÁTICA E E STATÍSTICA DA U NIVERSIDADE DE S ÃO PAULO Programa: Estatística Orientadora: Profa. Dra. Mônica Carneiro Sandoval São Paulo, junho de 2019

Transcript of Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise...

Page 1: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

Diagnoacutestico no modelo de regressatildeologiacutestica ordinal

Marina Calais de Freitas Moura

DISSERTACcedilAtildeO DE MESTRADOINSTITUTO DE MATEMAacuteTICA E ESTATIacuteSTICA

DAUNIVERSIDADE DE SAtildeO PAULO

Programa Estatiacutestica

Orientadora Profa Dra Mocircnica Carneiro Sandoval

Satildeo Paulo junho de 2019

Diagnoacutestico no modelo de regressatildeologiacutestica ordinal

Esta versatildeo da dissertaccedilatildeo conteacutem as correccedilotildees e alteraccedilotildees sugeridas

pela Comissatildeo Julgadora durante a defesa da versatildeo original do trabalho

realizada em 11062019 Uma coacutepia da versatildeo original estaacute disponiacutevel no

Instituto de Matemaacutetica e Estatiacutestica da Universidade de Satildeo Paulo

Comissatildeo Julgadora

bull Profa Dra Mocircnica Carneiro Sandoval - IME-USP

bull Prof Dr Gustavo Henrique de Arauacutejo Pereira - UFSCar

bull Prof Dr Joatildeo Ricardo Saito - UFABC

Agradecimentos

A Deus por permitir que continuasse os estudos

Aos meus pais Eivanyr de Moura e Maria Joseacute de Freitas Moura e minhas irmatildes Mocircnica Moura

da Silveira Lima Baacuterbara de Freitas Moura e Ana Maria Moura por todo amor e apoio

Agraves professoras Mocircnica Carneiro Sandoval e Denise Aparecida Botter por todos ensinamentos

A todos professores e amigos que me incentivaram

i

ii

Resumo

MOURA M C F Diagnoacutestico no modelo de regressatildeo logiacutestica ordinal 2019 66 f Dissetaccedilatildeo

(Mestrado) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019

Os modelos de regressatildeo logiacutestica ordinais satildeo usados para descrever a relaccedilatildeo entre uma variaacute-

vel resposta categoacuterica ordinal e uma ou mais variaacuteveis explanatoacuterias Uma vez ajustado o modelo de

regressatildeo se faz necessaacuterio verificar a qualidade do ajuste do modelo As estatiacutesticas qui-quadrado

de Pearson e da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para acessar a qualidade do ajuste do

modelo de regressatildeo logiacutestica ordinal quando variaacuteveis contiacutenuas estatildeo presentes no modelo Para

este caso foram propostos os testes de Lipsitz a versatildeo ordinal do teste de Hosmer-Lemeshow e os

testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkistenis-Robinson Nesta dissertaccedilatildeo eacute feita

uma revisatildeo das teacutecnicas de diagnoacutestico disponiacuteveis para os Modelos logito cumulativo Modelos

logito categorias adjacentes e Modelos logito razatildeo contiacutenua bem como uma aplicaccedilatildeo a fim de

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e aspectos emocionais nos idosos

Palavras-chave teste de Lipsitz testes qui-quadradado e da razatildeo de verossimilhanccedilas de Pulkstenis-

Robinson versatildeo ordinal do teste Hosmer-Lemeshow

iii

iv

Abstract

MOURA M C F Diagnostic of ordinal logistic regression model 2019 66 f Dissertation (Mas-

teracutes degree) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019

Ordinal regression models are used to describe the relationship between an ordered categorical

response variable and one or more explanatory variables which could be discrete or continuous

Once the regression model has been fitted it is necessary to check the goodness-of-fit of the model

The Pearson and likelihood-ratio statistics are not adequate for assessing goodness-of-fit in ordinal

logistic regression model with continuous explanatory variables For this case the Lipsitz test the

ordinal version of the Hosmer-Lemeshow test and Pulkstenis-Robinson chi-square and likelihood

ratio tests were proposed This dissertation aims to review the diagnostic techniques available for

the cumulative logit models categories adjacent logit models and continuous ratio logistic models

In addition an application was developed in order to investigate the relationship between hearing

loss balance and emotional aspects in the elderly

Keywords Lipsitz test Pulkstenis-Robinson chi-squared and likelihood-ratio test ordinal version of

the Hosmer-Lemeshow test

v

vi

Sumaacuterio

Lista de Abreviaturas ix

Lista de Figuras xi

Lista de Tabelas xi

1 Introduccedilatildeo 1

11 Objetivos 2

12 Organizaccedilatildeo do texto 3

2 Modelos de Regressatildeo Logiacutestica Ordinal 5

21 Modelos lineares generalizados 5

22 Modelo de regressatildeo logiacutestica 6

23 Principais modelos ordinais 8

231 Modelo logito cumulativo 8

232 Modelo logito categorias adjacentes 11

233 Modelo logito razatildeo contiacutenua 13

3 Teacutecnicas de Diagnoacutestico 17

31 Conceitos baacutesicos 17

32 Testes da qualidade do ajuste do modelo 18

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18

322 Teste de Lipsitz 20

323 Teste de Pulkstenis-Robinson 22

324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23

325 Comparaccedilatildeo entre os testes 24

33 Teste de proporcionalidade 25

34 Anaacutelise de resiacuteduos 26

35 Criteacuterio de informaccedilatildeo Akaike 27

36 Meacutetodo de seleccedilatildeo 27

4 Aplicaccedilotildees 29

41 Dados utilizados 29

42 Anaacutelise inferencial 30

421 Prova Time Up and Go 30

422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34

5 Conclusotildees e sugestotildees para pesquisas futuras 41

vii

viii SUMAacuteRIO

A Anaacutelise descritiva 43

B Coacutedigos usados no software R 47

Referecircncias Bibliograacuteficas 51

Lista de Abreviaturas

AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)

ix

x LISTA DE ABREVIATURAS

Lista de Figuras

21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10

41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 1 35

42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 2 38

A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44

A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua

audiccedilatildeo eacute 45

Lista de Tabelas

31 Tabela de contingecircncia 17

32 Frequecircncias observadas 24

41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31

42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31

43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32

44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32

45 AIC dos modelos ajustados - Prova Time Up and Go 34

46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34

47 Estimativas dos paracircmetros do modelo final adotado 35

48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -

modelo final 35

49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36

410 Estimativas dos paracircmetros do modelo selecionado 37

411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -

modelo final 37

412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40

A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43

A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43

xi

xii LISTA DE TABELAS

A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43

A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43

A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia

comeccedilou a perceber 44

A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44

A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-

ridade 44

A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda

mensal 45

A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45

A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando

a famiacutelia comeccedilou a perceber 45

A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova

de Unterberg com olhos abertos 46

Capiacutetulo 1

Introduccedilatildeo

Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel

atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer

2006)

No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum

para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados

nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um

paciente

Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O

primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias

natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute

o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas

influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino

fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma

variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20

20-40 40-60 60-80 acima de 80)

Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis

nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a

ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados

meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser

utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias

Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata

variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e

consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos

outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo

O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto

1

2 INTRODUCcedilAtildeO 12

por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por

Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um

caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn

(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel

resposta aleacutem da distribuiccedilatildeo normal

Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais

Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo

logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de

comparaccedilatildeo que faz mais sentido para o estudo

Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal

e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel

resposta satildeo comparadas

Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja

verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes

valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada

pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as

variaacuteveis explanatoacuterias sejam categoacutericas

Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al

(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow

para modelos de regressatildeo logiacutestica

Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-

similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas

Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow

Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances

proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo

Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com

chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais

11 Objetivos

Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do

ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em

que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas

observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute

12 ORGANIZACcedilAtildeO DO TEXTO 3

ilustrar os meacutetodos estudados a conjuntos de dados reais

12 Organizaccedilatildeo do texto

No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados

na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito

categorias adjacentes e Modelo logito razatildeo contiacutenua

Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2

satildeo discutidos no Capiacutetulo 3

O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos

Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 2: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

Diagnoacutestico no modelo de regressatildeologiacutestica ordinal

Esta versatildeo da dissertaccedilatildeo conteacutem as correccedilotildees e alteraccedilotildees sugeridas

pela Comissatildeo Julgadora durante a defesa da versatildeo original do trabalho

realizada em 11062019 Uma coacutepia da versatildeo original estaacute disponiacutevel no

Instituto de Matemaacutetica e Estatiacutestica da Universidade de Satildeo Paulo

Comissatildeo Julgadora

bull Profa Dra Mocircnica Carneiro Sandoval - IME-USP

bull Prof Dr Gustavo Henrique de Arauacutejo Pereira - UFSCar

bull Prof Dr Joatildeo Ricardo Saito - UFABC

Agradecimentos

A Deus por permitir que continuasse os estudos

Aos meus pais Eivanyr de Moura e Maria Joseacute de Freitas Moura e minhas irmatildes Mocircnica Moura

da Silveira Lima Baacuterbara de Freitas Moura e Ana Maria Moura por todo amor e apoio

Agraves professoras Mocircnica Carneiro Sandoval e Denise Aparecida Botter por todos ensinamentos

A todos professores e amigos que me incentivaram

i

ii

Resumo

MOURA M C F Diagnoacutestico no modelo de regressatildeo logiacutestica ordinal 2019 66 f Dissetaccedilatildeo

(Mestrado) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019

Os modelos de regressatildeo logiacutestica ordinais satildeo usados para descrever a relaccedilatildeo entre uma variaacute-

vel resposta categoacuterica ordinal e uma ou mais variaacuteveis explanatoacuterias Uma vez ajustado o modelo de

regressatildeo se faz necessaacuterio verificar a qualidade do ajuste do modelo As estatiacutesticas qui-quadrado

de Pearson e da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para acessar a qualidade do ajuste do

modelo de regressatildeo logiacutestica ordinal quando variaacuteveis contiacutenuas estatildeo presentes no modelo Para

este caso foram propostos os testes de Lipsitz a versatildeo ordinal do teste de Hosmer-Lemeshow e os

testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkistenis-Robinson Nesta dissertaccedilatildeo eacute feita

uma revisatildeo das teacutecnicas de diagnoacutestico disponiacuteveis para os Modelos logito cumulativo Modelos

logito categorias adjacentes e Modelos logito razatildeo contiacutenua bem como uma aplicaccedilatildeo a fim de

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e aspectos emocionais nos idosos

Palavras-chave teste de Lipsitz testes qui-quadradado e da razatildeo de verossimilhanccedilas de Pulkstenis-

Robinson versatildeo ordinal do teste Hosmer-Lemeshow

iii

iv

Abstract

MOURA M C F Diagnostic of ordinal logistic regression model 2019 66 f Dissertation (Mas-

teracutes degree) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019

Ordinal regression models are used to describe the relationship between an ordered categorical

response variable and one or more explanatory variables which could be discrete or continuous

Once the regression model has been fitted it is necessary to check the goodness-of-fit of the model

The Pearson and likelihood-ratio statistics are not adequate for assessing goodness-of-fit in ordinal

logistic regression model with continuous explanatory variables For this case the Lipsitz test the

ordinal version of the Hosmer-Lemeshow test and Pulkstenis-Robinson chi-square and likelihood

ratio tests were proposed This dissertation aims to review the diagnostic techniques available for

the cumulative logit models categories adjacent logit models and continuous ratio logistic models

In addition an application was developed in order to investigate the relationship between hearing

loss balance and emotional aspects in the elderly

Keywords Lipsitz test Pulkstenis-Robinson chi-squared and likelihood-ratio test ordinal version of

the Hosmer-Lemeshow test

v

vi

Sumaacuterio

Lista de Abreviaturas ix

Lista de Figuras xi

Lista de Tabelas xi

1 Introduccedilatildeo 1

11 Objetivos 2

12 Organizaccedilatildeo do texto 3

2 Modelos de Regressatildeo Logiacutestica Ordinal 5

21 Modelos lineares generalizados 5

22 Modelo de regressatildeo logiacutestica 6

23 Principais modelos ordinais 8

231 Modelo logito cumulativo 8

232 Modelo logito categorias adjacentes 11

233 Modelo logito razatildeo contiacutenua 13

3 Teacutecnicas de Diagnoacutestico 17

31 Conceitos baacutesicos 17

32 Testes da qualidade do ajuste do modelo 18

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18

322 Teste de Lipsitz 20

323 Teste de Pulkstenis-Robinson 22

324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23

325 Comparaccedilatildeo entre os testes 24

33 Teste de proporcionalidade 25

34 Anaacutelise de resiacuteduos 26

35 Criteacuterio de informaccedilatildeo Akaike 27

36 Meacutetodo de seleccedilatildeo 27

4 Aplicaccedilotildees 29

41 Dados utilizados 29

42 Anaacutelise inferencial 30

421 Prova Time Up and Go 30

422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34

5 Conclusotildees e sugestotildees para pesquisas futuras 41

vii

viii SUMAacuteRIO

A Anaacutelise descritiva 43

B Coacutedigos usados no software R 47

Referecircncias Bibliograacuteficas 51

Lista de Abreviaturas

AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)

ix

x LISTA DE ABREVIATURAS

Lista de Figuras

21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10

41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 1 35

42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 2 38

A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44

A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua

audiccedilatildeo eacute 45

Lista de Tabelas

31 Tabela de contingecircncia 17

32 Frequecircncias observadas 24

41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31

42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31

43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32

44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32

45 AIC dos modelos ajustados - Prova Time Up and Go 34

46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34

47 Estimativas dos paracircmetros do modelo final adotado 35

48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -

modelo final 35

49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36

410 Estimativas dos paracircmetros do modelo selecionado 37

411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -

modelo final 37

412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40

A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43

A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43

xi

xii LISTA DE TABELAS

A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43

A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43

A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia

comeccedilou a perceber 44

A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44

A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-

ridade 44

A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda

mensal 45

A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45

A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando

a famiacutelia comeccedilou a perceber 45

A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova

de Unterberg com olhos abertos 46

Capiacutetulo 1

Introduccedilatildeo

Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel

atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer

2006)

No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum

para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados

nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um

paciente

Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O

primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias

natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute

o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas

influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino

fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma

variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20

20-40 40-60 60-80 acima de 80)

Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis

nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a

ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados

meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser

utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias

Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata

variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e

consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos

outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo

O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto

1

2 INTRODUCcedilAtildeO 12

por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por

Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um

caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn

(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel

resposta aleacutem da distribuiccedilatildeo normal

Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais

Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo

logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de

comparaccedilatildeo que faz mais sentido para o estudo

Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal

e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel

resposta satildeo comparadas

Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja

verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes

valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada

pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as

variaacuteveis explanatoacuterias sejam categoacutericas

Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al

(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow

para modelos de regressatildeo logiacutestica

Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-

similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas

Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow

Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances

proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo

Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com

chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais

11 Objetivos

Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do

ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em

que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas

observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute

12 ORGANIZACcedilAtildeO DO TEXTO 3

ilustrar os meacutetodos estudados a conjuntos de dados reais

12 Organizaccedilatildeo do texto

No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados

na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito

categorias adjacentes e Modelo logito razatildeo contiacutenua

Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2

satildeo discutidos no Capiacutetulo 3

O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos

Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 3: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

Agradecimentos

A Deus por permitir que continuasse os estudos

Aos meus pais Eivanyr de Moura e Maria Joseacute de Freitas Moura e minhas irmatildes Mocircnica Moura

da Silveira Lima Baacuterbara de Freitas Moura e Ana Maria Moura por todo amor e apoio

Agraves professoras Mocircnica Carneiro Sandoval e Denise Aparecida Botter por todos ensinamentos

A todos professores e amigos que me incentivaram

i

ii

Resumo

MOURA M C F Diagnoacutestico no modelo de regressatildeo logiacutestica ordinal 2019 66 f Dissetaccedilatildeo

(Mestrado) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019

Os modelos de regressatildeo logiacutestica ordinais satildeo usados para descrever a relaccedilatildeo entre uma variaacute-

vel resposta categoacuterica ordinal e uma ou mais variaacuteveis explanatoacuterias Uma vez ajustado o modelo de

regressatildeo se faz necessaacuterio verificar a qualidade do ajuste do modelo As estatiacutesticas qui-quadrado

de Pearson e da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para acessar a qualidade do ajuste do

modelo de regressatildeo logiacutestica ordinal quando variaacuteveis contiacutenuas estatildeo presentes no modelo Para

este caso foram propostos os testes de Lipsitz a versatildeo ordinal do teste de Hosmer-Lemeshow e os

testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkistenis-Robinson Nesta dissertaccedilatildeo eacute feita

uma revisatildeo das teacutecnicas de diagnoacutestico disponiacuteveis para os Modelos logito cumulativo Modelos

logito categorias adjacentes e Modelos logito razatildeo contiacutenua bem como uma aplicaccedilatildeo a fim de

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e aspectos emocionais nos idosos

Palavras-chave teste de Lipsitz testes qui-quadradado e da razatildeo de verossimilhanccedilas de Pulkstenis-

Robinson versatildeo ordinal do teste Hosmer-Lemeshow

iii

iv

Abstract

MOURA M C F Diagnostic of ordinal logistic regression model 2019 66 f Dissertation (Mas-

teracutes degree) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019

Ordinal regression models are used to describe the relationship between an ordered categorical

response variable and one or more explanatory variables which could be discrete or continuous

Once the regression model has been fitted it is necessary to check the goodness-of-fit of the model

The Pearson and likelihood-ratio statistics are not adequate for assessing goodness-of-fit in ordinal

logistic regression model with continuous explanatory variables For this case the Lipsitz test the

ordinal version of the Hosmer-Lemeshow test and Pulkstenis-Robinson chi-square and likelihood

ratio tests were proposed This dissertation aims to review the diagnostic techniques available for

the cumulative logit models categories adjacent logit models and continuous ratio logistic models

In addition an application was developed in order to investigate the relationship between hearing

loss balance and emotional aspects in the elderly

Keywords Lipsitz test Pulkstenis-Robinson chi-squared and likelihood-ratio test ordinal version of

the Hosmer-Lemeshow test

v

vi

Sumaacuterio

Lista de Abreviaturas ix

Lista de Figuras xi

Lista de Tabelas xi

1 Introduccedilatildeo 1

11 Objetivos 2

12 Organizaccedilatildeo do texto 3

2 Modelos de Regressatildeo Logiacutestica Ordinal 5

21 Modelos lineares generalizados 5

22 Modelo de regressatildeo logiacutestica 6

23 Principais modelos ordinais 8

231 Modelo logito cumulativo 8

232 Modelo logito categorias adjacentes 11

233 Modelo logito razatildeo contiacutenua 13

3 Teacutecnicas de Diagnoacutestico 17

31 Conceitos baacutesicos 17

32 Testes da qualidade do ajuste do modelo 18

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18

322 Teste de Lipsitz 20

323 Teste de Pulkstenis-Robinson 22

324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23

325 Comparaccedilatildeo entre os testes 24

33 Teste de proporcionalidade 25

34 Anaacutelise de resiacuteduos 26

35 Criteacuterio de informaccedilatildeo Akaike 27

36 Meacutetodo de seleccedilatildeo 27

4 Aplicaccedilotildees 29

41 Dados utilizados 29

42 Anaacutelise inferencial 30

421 Prova Time Up and Go 30

422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34

5 Conclusotildees e sugestotildees para pesquisas futuras 41

vii

viii SUMAacuteRIO

A Anaacutelise descritiva 43

B Coacutedigos usados no software R 47

Referecircncias Bibliograacuteficas 51

Lista de Abreviaturas

AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)

ix

x LISTA DE ABREVIATURAS

Lista de Figuras

21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10

41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 1 35

42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 2 38

A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44

A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua

audiccedilatildeo eacute 45

Lista de Tabelas

31 Tabela de contingecircncia 17

32 Frequecircncias observadas 24

41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31

42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31

43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32

44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32

45 AIC dos modelos ajustados - Prova Time Up and Go 34

46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34

47 Estimativas dos paracircmetros do modelo final adotado 35

48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -

modelo final 35

49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36

410 Estimativas dos paracircmetros do modelo selecionado 37

411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -

modelo final 37

412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40

A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43

A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43

xi

xii LISTA DE TABELAS

A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43

A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43

A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia

comeccedilou a perceber 44

A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44

A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-

ridade 44

A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda

mensal 45

A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45

A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando

a famiacutelia comeccedilou a perceber 45

A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova

de Unterberg com olhos abertos 46

Capiacutetulo 1

Introduccedilatildeo

Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel

atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer

2006)

No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum

para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados

nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um

paciente

Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O

primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias

natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute

o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas

influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino

fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma

variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20

20-40 40-60 60-80 acima de 80)

Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis

nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a

ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados

meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser

utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias

Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata

variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e

consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos

outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo

O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto

1

2 INTRODUCcedilAtildeO 12

por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por

Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um

caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn

(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel

resposta aleacutem da distribuiccedilatildeo normal

Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais

Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo

logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de

comparaccedilatildeo que faz mais sentido para o estudo

Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal

e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel

resposta satildeo comparadas

Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja

verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes

valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada

pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as

variaacuteveis explanatoacuterias sejam categoacutericas

Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al

(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow

para modelos de regressatildeo logiacutestica

Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-

similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas

Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow

Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances

proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo

Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com

chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais

11 Objetivos

Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do

ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em

que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas

observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute

12 ORGANIZACcedilAtildeO DO TEXTO 3

ilustrar os meacutetodos estudados a conjuntos de dados reais

12 Organizaccedilatildeo do texto

No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados

na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito

categorias adjacentes e Modelo logito razatildeo contiacutenua

Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2

satildeo discutidos no Capiacutetulo 3

O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos

Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 4: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

ii

Resumo

MOURA M C F Diagnoacutestico no modelo de regressatildeo logiacutestica ordinal 2019 66 f Dissetaccedilatildeo

(Mestrado) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019

Os modelos de regressatildeo logiacutestica ordinais satildeo usados para descrever a relaccedilatildeo entre uma variaacute-

vel resposta categoacuterica ordinal e uma ou mais variaacuteveis explanatoacuterias Uma vez ajustado o modelo de

regressatildeo se faz necessaacuterio verificar a qualidade do ajuste do modelo As estatiacutesticas qui-quadrado

de Pearson e da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para acessar a qualidade do ajuste do

modelo de regressatildeo logiacutestica ordinal quando variaacuteveis contiacutenuas estatildeo presentes no modelo Para

este caso foram propostos os testes de Lipsitz a versatildeo ordinal do teste de Hosmer-Lemeshow e os

testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkistenis-Robinson Nesta dissertaccedilatildeo eacute feita

uma revisatildeo das teacutecnicas de diagnoacutestico disponiacuteveis para os Modelos logito cumulativo Modelos

logito categorias adjacentes e Modelos logito razatildeo contiacutenua bem como uma aplicaccedilatildeo a fim de

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e aspectos emocionais nos idosos

Palavras-chave teste de Lipsitz testes qui-quadradado e da razatildeo de verossimilhanccedilas de Pulkstenis-

Robinson versatildeo ordinal do teste Hosmer-Lemeshow

iii

iv

Abstract

MOURA M C F Diagnostic of ordinal logistic regression model 2019 66 f Dissertation (Mas-

teracutes degree) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019

Ordinal regression models are used to describe the relationship between an ordered categorical

response variable and one or more explanatory variables which could be discrete or continuous

Once the regression model has been fitted it is necessary to check the goodness-of-fit of the model

The Pearson and likelihood-ratio statistics are not adequate for assessing goodness-of-fit in ordinal

logistic regression model with continuous explanatory variables For this case the Lipsitz test the

ordinal version of the Hosmer-Lemeshow test and Pulkstenis-Robinson chi-square and likelihood

ratio tests were proposed This dissertation aims to review the diagnostic techniques available for

the cumulative logit models categories adjacent logit models and continuous ratio logistic models

In addition an application was developed in order to investigate the relationship between hearing

loss balance and emotional aspects in the elderly

Keywords Lipsitz test Pulkstenis-Robinson chi-squared and likelihood-ratio test ordinal version of

the Hosmer-Lemeshow test

v

vi

Sumaacuterio

Lista de Abreviaturas ix

Lista de Figuras xi

Lista de Tabelas xi

1 Introduccedilatildeo 1

11 Objetivos 2

12 Organizaccedilatildeo do texto 3

2 Modelos de Regressatildeo Logiacutestica Ordinal 5

21 Modelos lineares generalizados 5

22 Modelo de regressatildeo logiacutestica 6

23 Principais modelos ordinais 8

231 Modelo logito cumulativo 8

232 Modelo logito categorias adjacentes 11

233 Modelo logito razatildeo contiacutenua 13

3 Teacutecnicas de Diagnoacutestico 17

31 Conceitos baacutesicos 17

32 Testes da qualidade do ajuste do modelo 18

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18

322 Teste de Lipsitz 20

323 Teste de Pulkstenis-Robinson 22

324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23

325 Comparaccedilatildeo entre os testes 24

33 Teste de proporcionalidade 25

34 Anaacutelise de resiacuteduos 26

35 Criteacuterio de informaccedilatildeo Akaike 27

36 Meacutetodo de seleccedilatildeo 27

4 Aplicaccedilotildees 29

41 Dados utilizados 29

42 Anaacutelise inferencial 30

421 Prova Time Up and Go 30

422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34

5 Conclusotildees e sugestotildees para pesquisas futuras 41

vii

viii SUMAacuteRIO

A Anaacutelise descritiva 43

B Coacutedigos usados no software R 47

Referecircncias Bibliograacuteficas 51

Lista de Abreviaturas

AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)

ix

x LISTA DE ABREVIATURAS

Lista de Figuras

21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10

41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 1 35

42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 2 38

A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44

A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua

audiccedilatildeo eacute 45

Lista de Tabelas

31 Tabela de contingecircncia 17

32 Frequecircncias observadas 24

41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31

42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31

43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32

44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32

45 AIC dos modelos ajustados - Prova Time Up and Go 34

46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34

47 Estimativas dos paracircmetros do modelo final adotado 35

48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -

modelo final 35

49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36

410 Estimativas dos paracircmetros do modelo selecionado 37

411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -

modelo final 37

412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40

A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43

A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43

xi

xii LISTA DE TABELAS

A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43

A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43

A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia

comeccedilou a perceber 44

A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44

A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-

ridade 44

A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda

mensal 45

A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45

A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando

a famiacutelia comeccedilou a perceber 45

A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova

de Unterberg com olhos abertos 46

Capiacutetulo 1

Introduccedilatildeo

Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel

atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer

2006)

No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum

para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados

nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um

paciente

Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O

primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias

natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute

o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas

influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino

fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma

variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20

20-40 40-60 60-80 acima de 80)

Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis

nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a

ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados

meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser

utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias

Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata

variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e

consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos

outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo

O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto

1

2 INTRODUCcedilAtildeO 12

por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por

Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um

caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn

(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel

resposta aleacutem da distribuiccedilatildeo normal

Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais

Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo

logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de

comparaccedilatildeo que faz mais sentido para o estudo

Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal

e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel

resposta satildeo comparadas

Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja

verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes

valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada

pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as

variaacuteveis explanatoacuterias sejam categoacutericas

Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al

(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow

para modelos de regressatildeo logiacutestica

Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-

similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas

Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow

Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances

proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo

Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com

chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais

11 Objetivos

Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do

ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em

que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas

observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute

12 ORGANIZACcedilAtildeO DO TEXTO 3

ilustrar os meacutetodos estudados a conjuntos de dados reais

12 Organizaccedilatildeo do texto

No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados

na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito

categorias adjacentes e Modelo logito razatildeo contiacutenua

Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2

satildeo discutidos no Capiacutetulo 3

O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos

Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 5: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

Resumo

MOURA M C F Diagnoacutestico no modelo de regressatildeo logiacutestica ordinal 2019 66 f Dissetaccedilatildeo

(Mestrado) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019

Os modelos de regressatildeo logiacutestica ordinais satildeo usados para descrever a relaccedilatildeo entre uma variaacute-

vel resposta categoacuterica ordinal e uma ou mais variaacuteveis explanatoacuterias Uma vez ajustado o modelo de

regressatildeo se faz necessaacuterio verificar a qualidade do ajuste do modelo As estatiacutesticas qui-quadrado

de Pearson e da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para acessar a qualidade do ajuste do

modelo de regressatildeo logiacutestica ordinal quando variaacuteveis contiacutenuas estatildeo presentes no modelo Para

este caso foram propostos os testes de Lipsitz a versatildeo ordinal do teste de Hosmer-Lemeshow e os

testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkistenis-Robinson Nesta dissertaccedilatildeo eacute feita

uma revisatildeo das teacutecnicas de diagnoacutestico disponiacuteveis para os Modelos logito cumulativo Modelos

logito categorias adjacentes e Modelos logito razatildeo contiacutenua bem como uma aplicaccedilatildeo a fim de

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e aspectos emocionais nos idosos

Palavras-chave teste de Lipsitz testes qui-quadradado e da razatildeo de verossimilhanccedilas de Pulkstenis-

Robinson versatildeo ordinal do teste Hosmer-Lemeshow

iii

iv

Abstract

MOURA M C F Diagnostic of ordinal logistic regression model 2019 66 f Dissertation (Mas-

teracutes degree) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019

Ordinal regression models are used to describe the relationship between an ordered categorical

response variable and one or more explanatory variables which could be discrete or continuous

Once the regression model has been fitted it is necessary to check the goodness-of-fit of the model

The Pearson and likelihood-ratio statistics are not adequate for assessing goodness-of-fit in ordinal

logistic regression model with continuous explanatory variables For this case the Lipsitz test the

ordinal version of the Hosmer-Lemeshow test and Pulkstenis-Robinson chi-square and likelihood

ratio tests were proposed This dissertation aims to review the diagnostic techniques available for

the cumulative logit models categories adjacent logit models and continuous ratio logistic models

In addition an application was developed in order to investigate the relationship between hearing

loss balance and emotional aspects in the elderly

Keywords Lipsitz test Pulkstenis-Robinson chi-squared and likelihood-ratio test ordinal version of

the Hosmer-Lemeshow test

v

vi

Sumaacuterio

Lista de Abreviaturas ix

Lista de Figuras xi

Lista de Tabelas xi

1 Introduccedilatildeo 1

11 Objetivos 2

12 Organizaccedilatildeo do texto 3

2 Modelos de Regressatildeo Logiacutestica Ordinal 5

21 Modelos lineares generalizados 5

22 Modelo de regressatildeo logiacutestica 6

23 Principais modelos ordinais 8

231 Modelo logito cumulativo 8

232 Modelo logito categorias adjacentes 11

233 Modelo logito razatildeo contiacutenua 13

3 Teacutecnicas de Diagnoacutestico 17

31 Conceitos baacutesicos 17

32 Testes da qualidade do ajuste do modelo 18

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18

322 Teste de Lipsitz 20

323 Teste de Pulkstenis-Robinson 22

324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23

325 Comparaccedilatildeo entre os testes 24

33 Teste de proporcionalidade 25

34 Anaacutelise de resiacuteduos 26

35 Criteacuterio de informaccedilatildeo Akaike 27

36 Meacutetodo de seleccedilatildeo 27

4 Aplicaccedilotildees 29

41 Dados utilizados 29

42 Anaacutelise inferencial 30

421 Prova Time Up and Go 30

422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34

5 Conclusotildees e sugestotildees para pesquisas futuras 41

vii

viii SUMAacuteRIO

A Anaacutelise descritiva 43

B Coacutedigos usados no software R 47

Referecircncias Bibliograacuteficas 51

Lista de Abreviaturas

AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)

ix

x LISTA DE ABREVIATURAS

Lista de Figuras

21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10

41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 1 35

42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 2 38

A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44

A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua

audiccedilatildeo eacute 45

Lista de Tabelas

31 Tabela de contingecircncia 17

32 Frequecircncias observadas 24

41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31

42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31

43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32

44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32

45 AIC dos modelos ajustados - Prova Time Up and Go 34

46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34

47 Estimativas dos paracircmetros do modelo final adotado 35

48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -

modelo final 35

49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36

410 Estimativas dos paracircmetros do modelo selecionado 37

411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -

modelo final 37

412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40

A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43

A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43

xi

xii LISTA DE TABELAS

A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43

A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43

A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia

comeccedilou a perceber 44

A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44

A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-

ridade 44

A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda

mensal 45

A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45

A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando

a famiacutelia comeccedilou a perceber 45

A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova

de Unterberg com olhos abertos 46

Capiacutetulo 1

Introduccedilatildeo

Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel

atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer

2006)

No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum

para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados

nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um

paciente

Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O

primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias

natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute

o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas

influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino

fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma

variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20

20-40 40-60 60-80 acima de 80)

Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis

nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a

ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados

meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser

utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias

Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata

variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e

consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos

outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo

O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto

1

2 INTRODUCcedilAtildeO 12

por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por

Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um

caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn

(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel

resposta aleacutem da distribuiccedilatildeo normal

Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais

Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo

logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de

comparaccedilatildeo que faz mais sentido para o estudo

Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal

e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel

resposta satildeo comparadas

Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja

verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes

valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada

pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as

variaacuteveis explanatoacuterias sejam categoacutericas

Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al

(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow

para modelos de regressatildeo logiacutestica

Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-

similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas

Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow

Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances

proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo

Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com

chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais

11 Objetivos

Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do

ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em

que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas

observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute

12 ORGANIZACcedilAtildeO DO TEXTO 3

ilustrar os meacutetodos estudados a conjuntos de dados reais

12 Organizaccedilatildeo do texto

No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados

na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito

categorias adjacentes e Modelo logito razatildeo contiacutenua

Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2

satildeo discutidos no Capiacutetulo 3

O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos

Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 6: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

iv

Abstract

MOURA M C F Diagnostic of ordinal logistic regression model 2019 66 f Dissertation (Mas-

teracutes degree) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019

Ordinal regression models are used to describe the relationship between an ordered categorical

response variable and one or more explanatory variables which could be discrete or continuous

Once the regression model has been fitted it is necessary to check the goodness-of-fit of the model

The Pearson and likelihood-ratio statistics are not adequate for assessing goodness-of-fit in ordinal

logistic regression model with continuous explanatory variables For this case the Lipsitz test the

ordinal version of the Hosmer-Lemeshow test and Pulkstenis-Robinson chi-square and likelihood

ratio tests were proposed This dissertation aims to review the diagnostic techniques available for

the cumulative logit models categories adjacent logit models and continuous ratio logistic models

In addition an application was developed in order to investigate the relationship between hearing

loss balance and emotional aspects in the elderly

Keywords Lipsitz test Pulkstenis-Robinson chi-squared and likelihood-ratio test ordinal version of

the Hosmer-Lemeshow test

v

vi

Sumaacuterio

Lista de Abreviaturas ix

Lista de Figuras xi

Lista de Tabelas xi

1 Introduccedilatildeo 1

11 Objetivos 2

12 Organizaccedilatildeo do texto 3

2 Modelos de Regressatildeo Logiacutestica Ordinal 5

21 Modelos lineares generalizados 5

22 Modelo de regressatildeo logiacutestica 6

23 Principais modelos ordinais 8

231 Modelo logito cumulativo 8

232 Modelo logito categorias adjacentes 11

233 Modelo logito razatildeo contiacutenua 13

3 Teacutecnicas de Diagnoacutestico 17

31 Conceitos baacutesicos 17

32 Testes da qualidade do ajuste do modelo 18

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18

322 Teste de Lipsitz 20

323 Teste de Pulkstenis-Robinson 22

324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23

325 Comparaccedilatildeo entre os testes 24

33 Teste de proporcionalidade 25

34 Anaacutelise de resiacuteduos 26

35 Criteacuterio de informaccedilatildeo Akaike 27

36 Meacutetodo de seleccedilatildeo 27

4 Aplicaccedilotildees 29

41 Dados utilizados 29

42 Anaacutelise inferencial 30

421 Prova Time Up and Go 30

422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34

5 Conclusotildees e sugestotildees para pesquisas futuras 41

vii

viii SUMAacuteRIO

A Anaacutelise descritiva 43

B Coacutedigos usados no software R 47

Referecircncias Bibliograacuteficas 51

Lista de Abreviaturas

AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)

ix

x LISTA DE ABREVIATURAS

Lista de Figuras

21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10

41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 1 35

42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 2 38

A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44

A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua

audiccedilatildeo eacute 45

Lista de Tabelas

31 Tabela de contingecircncia 17

32 Frequecircncias observadas 24

41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31

42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31

43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32

44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32

45 AIC dos modelos ajustados - Prova Time Up and Go 34

46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34

47 Estimativas dos paracircmetros do modelo final adotado 35

48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -

modelo final 35

49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36

410 Estimativas dos paracircmetros do modelo selecionado 37

411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -

modelo final 37

412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40

A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43

A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43

xi

xii LISTA DE TABELAS

A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43

A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43

A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia

comeccedilou a perceber 44

A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44

A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-

ridade 44

A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda

mensal 45

A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45

A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando

a famiacutelia comeccedilou a perceber 45

A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova

de Unterberg com olhos abertos 46

Capiacutetulo 1

Introduccedilatildeo

Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel

atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer

2006)

No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum

para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados

nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um

paciente

Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O

primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias

natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute

o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas

influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino

fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma

variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20

20-40 40-60 60-80 acima de 80)

Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis

nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a

ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados

meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser

utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias

Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata

variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e

consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos

outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo

O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto

1

2 INTRODUCcedilAtildeO 12

por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por

Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um

caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn

(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel

resposta aleacutem da distribuiccedilatildeo normal

Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais

Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo

logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de

comparaccedilatildeo que faz mais sentido para o estudo

Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal

e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel

resposta satildeo comparadas

Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja

verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes

valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada

pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as

variaacuteveis explanatoacuterias sejam categoacutericas

Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al

(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow

para modelos de regressatildeo logiacutestica

Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-

similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas

Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow

Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances

proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo

Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com

chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais

11 Objetivos

Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do

ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em

que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas

observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute

12 ORGANIZACcedilAtildeO DO TEXTO 3

ilustrar os meacutetodos estudados a conjuntos de dados reais

12 Organizaccedilatildeo do texto

No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados

na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito

categorias adjacentes e Modelo logito razatildeo contiacutenua

Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2

satildeo discutidos no Capiacutetulo 3

O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos

Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 7: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

Abstract

MOURA M C F Diagnostic of ordinal logistic regression model 2019 66 f Dissertation (Mas-

teracutes degree) - Instituto de Matemaacutetica e Estatiacutestica Universidade de Satildeo Paulo Satildeo Paulo 2019

Ordinal regression models are used to describe the relationship between an ordered categorical

response variable and one or more explanatory variables which could be discrete or continuous

Once the regression model has been fitted it is necessary to check the goodness-of-fit of the model

The Pearson and likelihood-ratio statistics are not adequate for assessing goodness-of-fit in ordinal

logistic regression model with continuous explanatory variables For this case the Lipsitz test the

ordinal version of the Hosmer-Lemeshow test and Pulkstenis-Robinson chi-square and likelihood

ratio tests were proposed This dissertation aims to review the diagnostic techniques available for

the cumulative logit models categories adjacent logit models and continuous ratio logistic models

In addition an application was developed in order to investigate the relationship between hearing

loss balance and emotional aspects in the elderly

Keywords Lipsitz test Pulkstenis-Robinson chi-squared and likelihood-ratio test ordinal version of

the Hosmer-Lemeshow test

v

vi

Sumaacuterio

Lista de Abreviaturas ix

Lista de Figuras xi

Lista de Tabelas xi

1 Introduccedilatildeo 1

11 Objetivos 2

12 Organizaccedilatildeo do texto 3

2 Modelos de Regressatildeo Logiacutestica Ordinal 5

21 Modelos lineares generalizados 5

22 Modelo de regressatildeo logiacutestica 6

23 Principais modelos ordinais 8

231 Modelo logito cumulativo 8

232 Modelo logito categorias adjacentes 11

233 Modelo logito razatildeo contiacutenua 13

3 Teacutecnicas de Diagnoacutestico 17

31 Conceitos baacutesicos 17

32 Testes da qualidade do ajuste do modelo 18

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18

322 Teste de Lipsitz 20

323 Teste de Pulkstenis-Robinson 22

324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23

325 Comparaccedilatildeo entre os testes 24

33 Teste de proporcionalidade 25

34 Anaacutelise de resiacuteduos 26

35 Criteacuterio de informaccedilatildeo Akaike 27

36 Meacutetodo de seleccedilatildeo 27

4 Aplicaccedilotildees 29

41 Dados utilizados 29

42 Anaacutelise inferencial 30

421 Prova Time Up and Go 30

422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34

5 Conclusotildees e sugestotildees para pesquisas futuras 41

vii

viii SUMAacuteRIO

A Anaacutelise descritiva 43

B Coacutedigos usados no software R 47

Referecircncias Bibliograacuteficas 51

Lista de Abreviaturas

AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)

ix

x LISTA DE ABREVIATURAS

Lista de Figuras

21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10

41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 1 35

42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 2 38

A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44

A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua

audiccedilatildeo eacute 45

Lista de Tabelas

31 Tabela de contingecircncia 17

32 Frequecircncias observadas 24

41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31

42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31

43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32

44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32

45 AIC dos modelos ajustados - Prova Time Up and Go 34

46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34

47 Estimativas dos paracircmetros do modelo final adotado 35

48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -

modelo final 35

49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36

410 Estimativas dos paracircmetros do modelo selecionado 37

411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -

modelo final 37

412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40

A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43

A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43

xi

xii LISTA DE TABELAS

A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43

A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43

A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia

comeccedilou a perceber 44

A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44

A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-

ridade 44

A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda

mensal 45

A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45

A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando

a famiacutelia comeccedilou a perceber 45

A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova

de Unterberg com olhos abertos 46

Capiacutetulo 1

Introduccedilatildeo

Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel

atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer

2006)

No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum

para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados

nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um

paciente

Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O

primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias

natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute

o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas

influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino

fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma

variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20

20-40 40-60 60-80 acima de 80)

Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis

nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a

ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados

meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser

utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias

Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata

variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e

consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos

outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo

O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto

1

2 INTRODUCcedilAtildeO 12

por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por

Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um

caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn

(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel

resposta aleacutem da distribuiccedilatildeo normal

Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais

Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo

logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de

comparaccedilatildeo que faz mais sentido para o estudo

Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal

e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel

resposta satildeo comparadas

Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja

verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes

valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada

pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as

variaacuteveis explanatoacuterias sejam categoacutericas

Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al

(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow

para modelos de regressatildeo logiacutestica

Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-

similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas

Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow

Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances

proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo

Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com

chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais

11 Objetivos

Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do

ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em

que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas

observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute

12 ORGANIZACcedilAtildeO DO TEXTO 3

ilustrar os meacutetodos estudados a conjuntos de dados reais

12 Organizaccedilatildeo do texto

No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados

na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito

categorias adjacentes e Modelo logito razatildeo contiacutenua

Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2

satildeo discutidos no Capiacutetulo 3

O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos

Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 8: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

vi

Sumaacuterio

Lista de Abreviaturas ix

Lista de Figuras xi

Lista de Tabelas xi

1 Introduccedilatildeo 1

11 Objetivos 2

12 Organizaccedilatildeo do texto 3

2 Modelos de Regressatildeo Logiacutestica Ordinal 5

21 Modelos lineares generalizados 5

22 Modelo de regressatildeo logiacutestica 6

23 Principais modelos ordinais 8

231 Modelo logito cumulativo 8

232 Modelo logito categorias adjacentes 11

233 Modelo logito razatildeo contiacutenua 13

3 Teacutecnicas de Diagnoacutestico 17

31 Conceitos baacutesicos 17

32 Testes da qualidade do ajuste do modelo 18

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18

322 Teste de Lipsitz 20

323 Teste de Pulkstenis-Robinson 22

324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23

325 Comparaccedilatildeo entre os testes 24

33 Teste de proporcionalidade 25

34 Anaacutelise de resiacuteduos 26

35 Criteacuterio de informaccedilatildeo Akaike 27

36 Meacutetodo de seleccedilatildeo 27

4 Aplicaccedilotildees 29

41 Dados utilizados 29

42 Anaacutelise inferencial 30

421 Prova Time Up and Go 30

422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34

5 Conclusotildees e sugestotildees para pesquisas futuras 41

vii

viii SUMAacuteRIO

A Anaacutelise descritiva 43

B Coacutedigos usados no software R 47

Referecircncias Bibliograacuteficas 51

Lista de Abreviaturas

AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)

ix

x LISTA DE ABREVIATURAS

Lista de Figuras

21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10

41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 1 35

42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 2 38

A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44

A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua

audiccedilatildeo eacute 45

Lista de Tabelas

31 Tabela de contingecircncia 17

32 Frequecircncias observadas 24

41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31

42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31

43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32

44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32

45 AIC dos modelos ajustados - Prova Time Up and Go 34

46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34

47 Estimativas dos paracircmetros do modelo final adotado 35

48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -

modelo final 35

49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36

410 Estimativas dos paracircmetros do modelo selecionado 37

411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -

modelo final 37

412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40

A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43

A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43

xi

xii LISTA DE TABELAS

A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43

A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43

A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia

comeccedilou a perceber 44

A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44

A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-

ridade 44

A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda

mensal 45

A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45

A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando

a famiacutelia comeccedilou a perceber 45

A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova

de Unterberg com olhos abertos 46

Capiacutetulo 1

Introduccedilatildeo

Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel

atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer

2006)

No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum

para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados

nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um

paciente

Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O

primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias

natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute

o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas

influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino

fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma

variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20

20-40 40-60 60-80 acima de 80)

Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis

nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a

ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados

meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser

utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias

Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata

variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e

consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos

outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo

O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto

1

2 INTRODUCcedilAtildeO 12

por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por

Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um

caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn

(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel

resposta aleacutem da distribuiccedilatildeo normal

Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais

Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo

logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de

comparaccedilatildeo que faz mais sentido para o estudo

Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal

e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel

resposta satildeo comparadas

Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja

verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes

valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada

pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as

variaacuteveis explanatoacuterias sejam categoacutericas

Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al

(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow

para modelos de regressatildeo logiacutestica

Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-

similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas

Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow

Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances

proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo

Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com

chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais

11 Objetivos

Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do

ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em

que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas

observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute

12 ORGANIZACcedilAtildeO DO TEXTO 3

ilustrar os meacutetodos estudados a conjuntos de dados reais

12 Organizaccedilatildeo do texto

No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados

na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito

categorias adjacentes e Modelo logito razatildeo contiacutenua

Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2

satildeo discutidos no Capiacutetulo 3

O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos

Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 9: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

Sumaacuterio

Lista de Abreviaturas ix

Lista de Figuras xi

Lista de Tabelas xi

1 Introduccedilatildeo 1

11 Objetivos 2

12 Organizaccedilatildeo do texto 3

2 Modelos de Regressatildeo Logiacutestica Ordinal 5

21 Modelos lineares generalizados 5

22 Modelo de regressatildeo logiacutestica 6

23 Principais modelos ordinais 8

231 Modelo logito cumulativo 8

232 Modelo logito categorias adjacentes 11

233 Modelo logito razatildeo contiacutenua 13

3 Teacutecnicas de Diagnoacutestico 17

31 Conceitos baacutesicos 17

32 Testes da qualidade do ajuste do modelo 18

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas 18

322 Teste de Lipsitz 20

323 Teste de Pulkstenis-Robinson 22

324 Versatildeo ordinal do teste de Hosmer-Lemeshow 23

325 Comparaccedilatildeo entre os testes 24

33 Teste de proporcionalidade 25

34 Anaacutelise de resiacuteduos 26

35 Criteacuterio de informaccedilatildeo Akaike 27

36 Meacutetodo de seleccedilatildeo 27

4 Aplicaccedilotildees 29

41 Dados utilizados 29

42 Anaacutelise inferencial 30

421 Prova Time Up and Go 30

422 Em geral vocecirc diria que sua audiccedilatildeo eacute 34

5 Conclusotildees e sugestotildees para pesquisas futuras 41

vii

viii SUMAacuteRIO

A Anaacutelise descritiva 43

B Coacutedigos usados no software R 47

Referecircncias Bibliograacuteficas 51

Lista de Abreviaturas

AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)

ix

x LISTA DE ABREVIATURAS

Lista de Figuras

21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10

41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 1 35

42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 2 38

A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44

A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua

audiccedilatildeo eacute 45

Lista de Tabelas

31 Tabela de contingecircncia 17

32 Frequecircncias observadas 24

41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31

42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31

43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32

44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32

45 AIC dos modelos ajustados - Prova Time Up and Go 34

46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34

47 Estimativas dos paracircmetros do modelo final adotado 35

48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -

modelo final 35

49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36

410 Estimativas dos paracircmetros do modelo selecionado 37

411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -

modelo final 37

412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40

A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43

A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43

xi

xii LISTA DE TABELAS

A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43

A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43

A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia

comeccedilou a perceber 44

A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44

A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-

ridade 44

A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda

mensal 45

A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45

A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando

a famiacutelia comeccedilou a perceber 45

A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova

de Unterberg com olhos abertos 46

Capiacutetulo 1

Introduccedilatildeo

Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel

atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer

2006)

No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum

para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados

nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um

paciente

Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O

primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias

natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute

o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas

influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino

fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma

variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20

20-40 40-60 60-80 acima de 80)

Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis

nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a

ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados

meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser

utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias

Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata

variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e

consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos

outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo

O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto

1

2 INTRODUCcedilAtildeO 12

por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por

Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um

caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn

(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel

resposta aleacutem da distribuiccedilatildeo normal

Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais

Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo

logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de

comparaccedilatildeo que faz mais sentido para o estudo

Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal

e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel

resposta satildeo comparadas

Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja

verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes

valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada

pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as

variaacuteveis explanatoacuterias sejam categoacutericas

Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al

(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow

para modelos de regressatildeo logiacutestica

Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-

similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas

Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow

Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances

proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo

Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com

chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais

11 Objetivos

Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do

ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em

que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas

observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute

12 ORGANIZACcedilAtildeO DO TEXTO 3

ilustrar os meacutetodos estudados a conjuntos de dados reais

12 Organizaccedilatildeo do texto

No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados

na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito

categorias adjacentes e Modelo logito razatildeo contiacutenua

Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2

satildeo discutidos no Capiacutetulo 3

O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos

Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 10: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

viii SUMAacuteRIO

A Anaacutelise descritiva 43

B Coacutedigos usados no software R 47

Referecircncias Bibliograacuteficas 51

Lista de Abreviaturas

AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)

ix

x LISTA DE ABREVIATURAS

Lista de Figuras

21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10

41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 1 35

42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 2 38

A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44

A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua

audiccedilatildeo eacute 45

Lista de Tabelas

31 Tabela de contingecircncia 17

32 Frequecircncias observadas 24

41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31

42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31

43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32

44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32

45 AIC dos modelos ajustados - Prova Time Up and Go 34

46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34

47 Estimativas dos paracircmetros do modelo final adotado 35

48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -

modelo final 35

49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36

410 Estimativas dos paracircmetros do modelo selecionado 37

411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -

modelo final 37

412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40

A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43

A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43

xi

xii LISTA DE TABELAS

A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43

A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43

A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia

comeccedilou a perceber 44

A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44

A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-

ridade 44

A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda

mensal 45

A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45

A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando

a famiacutelia comeccedilou a perceber 45

A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova

de Unterberg com olhos abertos 46

Capiacutetulo 1

Introduccedilatildeo

Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel

atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer

2006)

No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum

para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados

nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um

paciente

Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O

primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias

natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute

o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas

influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino

fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma

variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20

20-40 40-60 60-80 acima de 80)

Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis

nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a

ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados

meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser

utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias

Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata

variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e

consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos

outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo

O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto

1

2 INTRODUCcedilAtildeO 12

por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por

Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um

caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn

(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel

resposta aleacutem da distribuiccedilatildeo normal

Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais

Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo

logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de

comparaccedilatildeo que faz mais sentido para o estudo

Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal

e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel

resposta satildeo comparadas

Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja

verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes

valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada

pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as

variaacuteveis explanatoacuterias sejam categoacutericas

Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al

(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow

para modelos de regressatildeo logiacutestica

Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-

similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas

Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow

Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances

proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo

Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com

chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais

11 Objetivos

Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do

ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em

que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas

observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute

12 ORGANIZACcedilAtildeO DO TEXTO 3

ilustrar os meacutetodos estudados a conjuntos de dados reais

12 Organizaccedilatildeo do texto

No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados

na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito

categorias adjacentes e Modelo logito razatildeo contiacutenua

Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2

satildeo discutidos no Capiacutetulo 3

O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos

Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 11: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

Lista de Abreviaturas

AIC Criteacuterio de Informaccedilatildeo Akaike (Akaike Information Criterion)IC Intervalo de Confianccedila (Confidence Interval)MLG Modelo Linear Generalizado (Generalized Linear Model)

ix

x LISTA DE ABREVIATURAS

Lista de Figuras

21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10

41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 1 35

42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 2 38

A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44

A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua

audiccedilatildeo eacute 45

Lista de Tabelas

31 Tabela de contingecircncia 17

32 Frequecircncias observadas 24

41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31

42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31

43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32

44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32

45 AIC dos modelos ajustados - Prova Time Up and Go 34

46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34

47 Estimativas dos paracircmetros do modelo final adotado 35

48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -

modelo final 35

49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36

410 Estimativas dos paracircmetros do modelo selecionado 37

411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -

modelo final 37

412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40

A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43

A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43

xi

xii LISTA DE TABELAS

A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43

A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43

A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia

comeccedilou a perceber 44

A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44

A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-

ridade 44

A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda

mensal 45

A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45

A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando

a famiacutelia comeccedilou a perceber 45

A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova

de Unterberg com olhos abertos 46

Capiacutetulo 1

Introduccedilatildeo

Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel

atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer

2006)

No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum

para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados

nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um

paciente

Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O

primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias

natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute

o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas

influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino

fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma

variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20

20-40 40-60 60-80 acima de 80)

Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis

nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a

ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados

meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser

utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias

Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata

variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e

consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos

outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo

O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto

1

2 INTRODUCcedilAtildeO 12

por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por

Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um

caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn

(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel

resposta aleacutem da distribuiccedilatildeo normal

Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais

Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo

logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de

comparaccedilatildeo que faz mais sentido para o estudo

Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal

e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel

resposta satildeo comparadas

Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja

verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes

valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada

pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as

variaacuteveis explanatoacuterias sejam categoacutericas

Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al

(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow

para modelos de regressatildeo logiacutestica

Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-

similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas

Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow

Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances

proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo

Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com

chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais

11 Objetivos

Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do

ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em

que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas

observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute

12 ORGANIZACcedilAtildeO DO TEXTO 3

ilustrar os meacutetodos estudados a conjuntos de dados reais

12 Organizaccedilatildeo do texto

No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados

na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito

categorias adjacentes e Modelo logito razatildeo contiacutenua

Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2

satildeo discutidos no Capiacutetulo 3

O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos

Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 12: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

x LISTA DE ABREVIATURAS

Lista de Figuras

21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10

41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 1 35

42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 2 38

A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44

A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua

audiccedilatildeo eacute 45

Lista de Tabelas

31 Tabela de contingecircncia 17

32 Frequecircncias observadas 24

41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31

42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31

43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32

44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32

45 AIC dos modelos ajustados - Prova Time Up and Go 34

46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34

47 Estimativas dos paracircmetros do modelo final adotado 35

48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -

modelo final 35

49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36

410 Estimativas dos paracircmetros do modelo selecionado 37

411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -

modelo final 37

412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40

A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43

A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43

xi

xii LISTA DE TABELAS

A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43

A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43

A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia

comeccedilou a perceber 44

A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44

A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-

ridade 44

A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda

mensal 45

A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45

A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando

a famiacutelia comeccedilou a perceber 45

A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova

de Unterberg com olhos abertos 46

Capiacutetulo 1

Introduccedilatildeo

Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel

atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer

2006)

No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum

para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados

nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um

paciente

Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O

primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias

natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute

o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas

influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino

fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma

variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20

20-40 40-60 60-80 acima de 80)

Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis

nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a

ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados

meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser

utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias

Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata

variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e

consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos

outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo

O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto

1

2 INTRODUCcedilAtildeO 12

por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por

Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um

caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn

(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel

resposta aleacutem da distribuiccedilatildeo normal

Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais

Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo

logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de

comparaccedilatildeo que faz mais sentido para o estudo

Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal

e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel

resposta satildeo comparadas

Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja

verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes

valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada

pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as

variaacuteveis explanatoacuterias sejam categoacutericas

Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al

(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow

para modelos de regressatildeo logiacutestica

Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-

similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas

Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow

Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances

proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo

Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com

chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais

11 Objetivos

Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do

ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em

que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas

observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute

12 ORGANIZACcedilAtildeO DO TEXTO 3

ilustrar os meacutetodos estudados a conjuntos de dados reais

12 Organizaccedilatildeo do texto

No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados

na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito

categorias adjacentes e Modelo logito razatildeo contiacutenua

Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2

satildeo discutidos no Capiacutetulo 3

O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos

Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 13: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

Lista de Figuras

21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionais 10

41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 1 35

42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo

eacute - situaccedilatildeo 2 38

A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go 44

A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua

audiccedilatildeo eacute 45

Lista de Tabelas

31 Tabela de contingecircncia 17

32 Frequecircncias observadas 24

41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1 31

42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1 31

43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2 32

44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2 32

45 AIC dos modelos ajustados - Prova Time Up and Go 34

46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 34

47 Estimativas dos paracircmetros do modelo final adotado 35

48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 -

modelo final 35

49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 36

410 Estimativas dos paracircmetros do modelo selecionado 37

411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 -

modelo final 37

412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute 40

A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo 43

A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade 43

xi

xii LISTA DE TABELAS

A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43

A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43

A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia

comeccedilou a perceber 44

A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44

A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-

ridade 44

A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda

mensal 45

A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45

A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando

a famiacutelia comeccedilou a perceber 45

A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova

de Unterberg com olhos abertos 46

Capiacutetulo 1

Introduccedilatildeo

Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel

atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer

2006)

No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum

para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados

nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um

paciente

Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O

primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias

natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute

o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas

influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino

fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma

variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20

20-40 40-60 60-80 acima de 80)

Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis

nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a

ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados

meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser

utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias

Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata

variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e

consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos

outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo

O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto

1

2 INTRODUCcedilAtildeO 12

por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por

Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um

caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn

(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel

resposta aleacutem da distribuiccedilatildeo normal

Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais

Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo

logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de

comparaccedilatildeo que faz mais sentido para o estudo

Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal

e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel

resposta satildeo comparadas

Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja

verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes

valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada

pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as

variaacuteveis explanatoacuterias sejam categoacutericas

Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al

(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow

para modelos de regressatildeo logiacutestica

Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-

similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas

Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow

Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances

proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo

Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com

chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais

11 Objetivos

Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do

ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em

que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas

observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute

12 ORGANIZACcedilAtildeO DO TEXTO 3

ilustrar os meacutetodos estudados a conjuntos de dados reais

12 Organizaccedilatildeo do texto

No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados

na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito

categorias adjacentes e Modelo logito razatildeo contiacutenua

Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2

satildeo discutidos no Capiacutetulo 3

O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos

Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 14: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

xii LISTA DE TABELAS

A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal 43

A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo 43

A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia

comeccedilou a perceber 44

A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo 44

A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escola-

ridade 44

A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda

mensal 45

A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo 45

A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando

a famiacutelia comeccedilou a perceber 45

A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova

de Unterberg com olhos abertos 46

Capiacutetulo 1

Introduccedilatildeo

Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel

atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer

2006)

No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum

para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados

nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um

paciente

Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O

primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias

natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute

o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas

influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino

fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma

variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20

20-40 40-60 60-80 acima de 80)

Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis

nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a

ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados

meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser

utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias

Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata

variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e

consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos

outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo

O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto

1

2 INTRODUCcedilAtildeO 12

por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por

Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um

caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn

(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel

resposta aleacutem da distribuiccedilatildeo normal

Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais

Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo

logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de

comparaccedilatildeo que faz mais sentido para o estudo

Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal

e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel

resposta satildeo comparadas

Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja

verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes

valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada

pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as

variaacuteveis explanatoacuterias sejam categoacutericas

Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al

(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow

para modelos de regressatildeo logiacutestica

Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-

similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas

Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow

Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances

proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo

Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com

chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais

11 Objetivos

Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do

ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em

que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas

observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute

12 ORGANIZACcedilAtildeO DO TEXTO 3

ilustrar os meacutetodos estudados a conjuntos de dados reais

12 Organizaccedilatildeo do texto

No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados

na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito

categorias adjacentes e Modelo logito razatildeo contiacutenua

Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2

satildeo discutidos no Capiacutetulo 3

O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos

Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 15: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

Capiacutetulo 1

Introduccedilatildeo

Ao longo dos anos meacutetodos para anaacutelise de dados categorizados tecircm recebido uma consideraacutevel

atenccedilatildeo devido ao crescente uso desse tipo de dados em diversas aplicaccedilotildees (Paulino e Singer

2006)

No acircmbito da Psicologia ou da Ciecircncias Sociais o uso de dados categorizados eacute muito comum

para medir atitudes opiniotildees ou preferecircncias Dados categorizados tambeacutem podem ser encontrados

nas aacutereas ligadas agrave Sauacutede por exemplo quando o interesse eacute avaliar a melhora ou natildeo de um

paciente

Dados categoacutericos ou qualitativos discriminam-se em trecircs tipos nominal ordinal e intervalar O

primeiro tipo ocorre quando a escala categoacuterica natildeo eacute ordenada ou seja a permutaccedilatildeo das categorias

natildeo afeta a anaacutelise estatiacutestica por exemplo estado conjugal (solteira casada divorciada viuacuteva) Jaacute

o segundo tipo ocorre quando suas categorias seguem uma ordenaccedilatildeo clara e a permutaccedilatildeo delas

influencia na anaacutelise estatiacutestica Como ilustraccedilatildeo tem-se a variaacutevel niacutevel de escolaridade (ensino

fundamental ensino meacutedio graduaccedilatildeo poacutes-graduaccedilatildeo) O tipo intervalar acontece quando uma

variaacutevel contiacutenua eacute resumida agrupando-se os valores em categorias por exemplo idade (0-20

20-40 40-60 60-80 acima de 80)

Meacutetodos desenvolvidos para anaacutelise de variaacuteveis nominais podem ser utilizados para variaacuteveis

nominais e ordinais uma vez que estes requerem apenas escala categoacuterica natildeo importando a

ordenaccedilatildeo das categorias Contudo resultados diferentes podem ser obtidos quando satildeo utilizados

meacutetodos desenvolvidos para anaacutelise de variaacuteveis ordinais Assim estes meacutetodos soacute podem ser

utilizados para variaacuteveis ordinais pois levam em conta a ordenaccedilatildeo das categorias

Quando a classificaccedilatildeo dos dados ordinais natildeo eacute totalmente explorada ou seja quando se trata

variaacuteveis ordinais ou intervalares como nominais as permutaccedilotildees das categorias satildeo irrelevantes e

consequentemente muita informaccedilatildeo eacute perdida O que distingue o uso dos modelos ordinais dos

outros eacute que estes produzem inferecircncias mais poderosas sobre as caracteriacutesticas da populaccedilatildeo

O Modelo logito cumulativo para anaacutelise de variaacuteveis resposta ordinais foi originalmente proposto

1

2 INTRODUCcedilAtildeO 12

por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por

Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um

caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn

(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel

resposta aleacutem da distribuiccedilatildeo normal

Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais

Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo

logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de

comparaccedilatildeo que faz mais sentido para o estudo

Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal

e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel

resposta satildeo comparadas

Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja

verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes

valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada

pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as

variaacuteveis explanatoacuterias sejam categoacutericas

Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al

(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow

para modelos de regressatildeo logiacutestica

Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-

similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas

Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow

Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances

proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo

Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com

chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais

11 Objetivos

Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do

ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em

que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas

observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute

12 ORGANIZACcedilAtildeO DO TEXTO 3

ilustrar os meacutetodos estudados a conjuntos de dados reais

12 Organizaccedilatildeo do texto

No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados

na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito

categorias adjacentes e Modelo logito razatildeo contiacutenua

Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2

satildeo discutidos no Capiacutetulo 3

O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos

Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 16: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

2 INTRODUCcedilAtildeO 12

por Walker e Duncan (1967) e posteriormente chamado de Modelo de chances proporcionais por

Cullagh (1980) Este modelo eacute uma extensatildeo do Modelo de regressatildeo logiacutestica que por sua vez eacute um

caso especial do Modelo Linear Generalizado (MLG) o qual foi proposto por Nelder e Wedderburn

(1972) que permite o uso de distribuiccedilotildees pertencentes agrave famiacutelia exponencial para a variaacutevel

resposta aleacutem da distribuiccedilatildeo normal

Aleacutem do Modelo logito cumulativo para anaacutelise de dados com variaacuteveis respostas ordinais

Agresti (1984) sugeriu o Modelo logito categorias adjacentes e Feinberg (1980) propocircs o Modelo

logito razatildeo contiacutenua Segundo Agresti (2010) a escolha do modelo estaacute associada ao tipo de

comparaccedilatildeo que faz mais sentido para o estudo

Os modelos supracitados satildeo uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta ordinal

e uma ou mais variaacuteveis explanatoacuterias Estes modelos diferem em como as categorias da variaacutevel

resposta satildeo comparadas

Depois de ajustado o modelo se faz necessaacuterio verificar a qualidade desse ajuste ou seja

verificar o quatildeo proacuteximo os valores preditos por este modelo se encontram de seus correspondentes

valores observados Para os modelos citados anteriormente esta qualidade pode ser averiguada

pela estatiacutestica de Pearson X2 e pela estatiacutestica da razatildeo de verossimilhanccedilas G2 desde que as

variaacuteveis explanatoacuterias sejam categoacutericas

Para o caso em que o modelo conteacutem pelo menos uma variaacutevel explanatoacuteria contiacutenua Lipsitz et al

(1996) propocircs um teste de qualidade de ajuste baseado parcialmente no teste de Hosmer-Lemeshow

para modelos de regressatildeo logiacutestica

Pulkstenis e Robinson (2004) modificaram a estatiacutestica de Pearson e da razatildeo de veros-

similhanccedilas para quando o modelo conteacutem variaacuteveis explanatoacuterias contiacutenuas e categoacutericas

Fagerland e Hosmer (2013) desenvolveram a versatildeo ordinal do teste de Hosmer-Lemeshow

Os testes mencionados foram desenvolvidos com base no Modelo logito cumulativo com chances

proporcionais que eacute o modelo mais utilizado na anaacutelise de dados categoacutericos ordinais Contudo

Fagerland e Hosmer (2016) estenderam os testes para os Modelos logito categorias adjacentes com

chances proporcionais e Modelo logito razatildeo contiacutenua com chances proporcionais

11 Objetivos

Um dos objetivos deste trabalho eacute revisar os meacutetodos disponiacuteveis para averiguar a qualidade do

ajuste dos Modelos de regressatildeo logiacutestica ordinais mais utilizados dando ecircnfase aos modelos em

que variaacuteveis explanatoacuterias contiacutenuas estatildeo presentes ou quando haacute dados esparsos (quando poucas

observaccedilotildees forem registradas em algumas das categorias da variaacutevel resposta) Outro objetivo eacute

12 ORGANIZACcedilAtildeO DO TEXTO 3

ilustrar os meacutetodos estudados a conjuntos de dados reais

12 Organizaccedilatildeo do texto

No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados

na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito

categorias adjacentes e Modelo logito razatildeo contiacutenua

Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2

satildeo discutidos no Capiacutetulo 3

O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos

Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 17: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

12 ORGANIZACcedilAtildeO DO TEXTO 3

ilustrar os meacutetodos estudados a conjuntos de dados reais

12 Organizaccedilatildeo do texto

No Capiacutetulo 2 satildeo abordados os conceitos baacutesicos relacionados aos principais modelos utilizados

na anaacutelise de dados com variaacutevel resposta ordinal Modelos logito cumulativo Modelo logito

categorias adjacentes e Modelo logito razatildeo contiacutenua

Os meacutetodos utilizados para verificar a qualidade do ajuste dos modelos estudados no Capiacutetulo 2

satildeo discutidos no Capiacutetulo 3

O Capiacutetulo 4 apresenta uma aplicaccedilatildeo referente ao estudo da perda auditiva em idosos

Por fim no Capiacutetulo 5 satildeo estabelecidas conclusotildees sobre o estudo realizado nessa dissertaccedilatildeo

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 18: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

4 INTRODUCcedilAtildeO 12

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 19: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

Capiacutetulo 2

Modelos de Regressatildeo Logiacutestica Ordinal

Neste capiacutetulo seraacute apresentada uma revisatildeo dos Modelos lineares generalizados e dos Modelos

de regressatildeo logiacutestica Seratildeo abordados ainda os modelos mais utilizados na anaacutelise de variaacuteveis

respostas ordinais que satildeo os Modelos logito cumulativo Modelos logito categorias adjacentes e

Modelos logito razatildeo contiacutenua

21 Modelos lineares generalizados

Ao longo de muitos anos utilizou-se a estrutura dos modelos de regressatildeo normais com o intuito

de descrever a maioria dos fenocircmenos aleatoacuterios ainda que estes fenocircmenos natildeo apresentassem

os criteacuterios que justificassem tal suposiccedilatildeo Nestes casos era sugerida uma transformaccedilatildeo a fim de

atender a normalidade poreacutem aleacutem de dificultar a interpretaccedilatildeo das variaacuteveis transformadas o

ajuste do modelo natildeo era muitas vezes satisfatoacuterio

Nelder e Wedderburn (1972) propuseram os Modelos lineares generalizados (MLG) que possibi-

litam a utilizaccedilatildeo de outras distribuiccedilotildees desde que pertenccedilam agrave famiacutelia exponencial de distribuiccedilotildees

Com a teoria e metodologia dos MLG a transformaccedilatildeo dos dados natildeo eacute necessaacuteria e a escolha da

distribuiccedilatildeo natildeo se restringe agrave normalidade O MLG foi introduzido com a finalidade de unificar

uma ampla variedade de modelos estatiacutesticos

Os Modelos lineares generalizados tecircm trecircs componentes

bull Componente Aleatoacuterio - seleciona a distribuiccedilatildeo de probabilidade da variaacutevel resposta Y

Este componente eacute composto por variaacuteveis aleatoacuterias Y1 Yn independentes pertencentes

agrave famiacutelia exponencial cada uma com funccedilatildeo densidade ou funccedilatildeo de probabilidade na forma

f(yi θi φ) = expφminus1[yiθi minus b(θi)] + c(yiφ)

em que b() e c() satildeo funccedilotildees reais conhecidas θi eacute o paracircmetro canocircnico φ eacute o paracircmetro

de dispersatildeo e o domiacutenio de yi sub R e natildeo depende de θi

5

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 20: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

6 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 22

Muitas distribuiccedilotildees satildeo casos especiais da famiacutelia exponencial Para os casos em que cada

observaccedilatildeo Yi eacute binaacuteria como em ensaios do tipo sucesso ou fracasso assume-se a distribuiccedilatildeo

de Bernoulli para cada elemento do componente aleatoacuterio Em outras aplicaccedilotildees em que

cada resposta eacute uma contagem natildeo negativa assume-se a distribuiccedilatildeo de Poisson para o

componente aleatoacuterio Para os casos em que as observaccedilotildees satildeo contiacutenuas assume-se por

exemplo que o componente aleatoacuterio tem distribuiccedilatildeo Normal ou distribuiccedilatildeo Gama

bull Componente sistemaacutetico ndash constituiacutedo pelas variaacuteveis explanatoacuterias usadas como preditores

no modelo

Este componente denominado preditor linear eacute a combinaccedilatildeo linear das p variaacuteveis explana-

toacuterias do modelo o qual tem a seguinte forma

ηi =sumj

βjxij i = 1 n e j = 1 p

em que βj eacute um paracircmetro desconhecido que descreve o efeito da j-eacutesima variaacutevel explanatoacuteria

e xij eacute o valor da j-eacutesima variaacutevel explanatoacuteria associado agrave i-esima unidade experimental

bull Funccedilatildeo de ligaccedilatildeo ndash descreve a relaccedilatildeo entre o componente sistemaacutetico e o valor esperado do

componente aleatoacuterio

A funccedilatildeo de ligaccedilatildeo eacute uma funccedilatildeo monoacutetona e diferenciaacutevel representada por g(microi) a qual

relaciona o componente sistemaacutetico (ηi) e a meacutedia do componente aleatoacuterio (microi) da seguinte

forma

ηi = g(microi)

Quando o paracircmetro canocircnico (θ) coincide com o preditor linear (θ = η) as funccedilotildees de ligaccedilatildeo

satildeo chamadas de funccedilotildees de ligaccedilatildeo canocircnicas Desta forma cada distribuiccedilatildeo possui a sua

funccedilatildeo de ligaccedilatildeo canocircnica correspondente

22 Modelo de regressatildeo logiacutestica

O Modelo de regressatildeo logiacutestica eacute um caso especial do MLG em que a variaacutevel resposta eacute binaacuteria

ou seja admite apenas dois resultados como por exemplo o resultado do diagnoacutestico de um exame

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 21: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

22 MODELO DE REGRESSAtildeO LOGIacuteSTICA 7

de laboratoacuterio positivo ou negativo (sucesso ou fracasso) Frequentemente chamamos de sucesso o

resultado de interesse para o estudo

Denote Yi como a variaacutevel resposta binaacuteria Desta forma Yi segue uma distribuiccedilatildeo de Bernoulli

em que P (Yi = 1) = πi eacute a probabilidade de sucesso e P (Yi = 0) = 1 minus πi eacute a probabilidade de

fracasso Esta distribuiccedilatildeo tem meacutedia E(Yi) = πi e variacircncia V ar(Yi) = πi(1minus πi)

Considere P (Yi = 1|xi) = πi = π(xi) a probabilidade de sucesso dado o valor xi de uma variaacutevel

explanatoacuteria (x) O modelo de regressatildeo logiacutestica tambeacutem chamado de modelo logito tem a seguinte

forma

logito[π(xi)] = logπ(xi)

1minus π(xi)= α+ βxi (21)

em que α e β satildeo os paracircmetros desconhecidos e ηi = α+ βx eacute o componente sistemaacutetico do MLG

Exponencializando (21) dos dois lados eacute possiacutevel obter as interpretaccedilotildees dos paracircmetros do

modelo Suponha que haja o interesse em analisar a associaccedilatildeo entre a artrite reumatoacuteide (presenccedila

ou ausecircncia) e o sexo (masculino feminino) Desta maneira seria coletada uma amostra de n1

indiviacuteduos do sexo masculino (xi = 1) e n2 indiviacuteduos do sexo feminino (xi = 0) Assim a chance

de desenvolvimento da doenccedila para um indiviacuteduo do sexo masculino eacute

π(1)

1minus π(1)= eα+β

enquanto que a chance de desenvolvimento da doenccedila para um indiviacuteduo do sexo feminino eacute

π(0)

1minus π(0)= eα

Logo a razatildeo de chances fica dada por

π(1)(1minus π(0))

π(0)(1minus π(1))= eβ

Este modelo provecirc a seguinte interpretaccedilatildeo a chance de um indiviacuteduo do sexo masculino ter

artrite reumatoacuteide eacute eβ vezes a chance de um indiviacuteduo do sexo feminino ter artrite reumatoacuteide

Suponha agora que haja interesse em analisar a relaccedilatildeo entre infarto do miocaacuterdio (sim ou natildeo)

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 22: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

8 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

e o nuacutemero de cigarros fumados por dia Quanto agrave interpretaccedilatildeo tem-se que para cada unidade

de aumento em x ou seja para cada unidade de aumento no nuacutemero de cigarros a chance de ter

infarto do miocaacuterdio eacute multiplicada por eβ

Aleacutem do logito existem outras funccedilotildees de ligaccedilatildeo que podem ser utilizadas para a variaacutevel

resposta binaacuteria tais como probito e complemento log-log Os modelos que utilizam essas ligaccedilotildees

podem ser verificados em Agresti (2003)

O modelo descrito neste seccedilatildeo eacute indicado quando a variaacutevel resposta eacute binaacuteria ou dicotocircmica

Contudo quando a variaacutevel resposta tem mais de duas categorias outros modelos satildeo apropriados

Para anaacutelise de dados que apresentam variaacutevel resposta nominal com mais de duas categorias um

modelo proposto eacute o modelo logito categoria de referecircncia (Agresti 1996) Este modelo natildeo leva

em conta a ordenaccedilatildeo das categorias

23 Principais modelos ordinais

O Modelo de regressatildeo logiacutestica ordinal eacute aplicado quando o nuacutemero de categorias da variaacutevel

resposta excede dois e quando estas satildeo ordenadas Existe uma variedade de modelos para variaacuteveis

ordinais que respeitam a natureza ordinal dos dados os quais satildeo aplicados quando haacute interesse em

verificar a relaccedilatildeo entre a variaacutevel resposta ordinal e as variaacuteveis explanatoacuterias de relevacircncia para o

estudo sendo que as variaacuteveis explanatoacuterias podem ser contiacutenuas ou categoacutericas

Quando se utiliza modelos nominais para variaacuteveis ordinais as permutaccedilotildees das categorias

satildeo irrelevantes e consequentemente muita informaccedilatildeo eacute perdida Meacutetodos ordinais possibilitam

descriccedilatildeo simples dos dados e permitem inferecircncias mais poderosas sobre as caracteriacutesticas da

populaccedilatildeo do que os modelos para variaacuteveis nominais que ignoram a informaccedilatildeo ordinal

A seguir seratildeo apresentados os modelos utilizados quando a variaacutevel resposta eacute ordinal que

utilizam a ligaccedilatildeo logito Assim como no Modelo de regressatildeo logiacutestica binaacuteria outros tipos de

ligaccedilotildees podem ser usados como probito e complemento log-log Os modelos que utilizam essas

ligaccedilotildees podem ser verificados em Agresti (2010)

231 Modelo logito cumulativo

Considerando uma variaacutevel resposta Yi com c categorias ordinais o logito cumulativo eacute definido

por

logito[P (Yi le j|xi)] = logP (Yi le j|xi)

1minus P (Yi le j|xi)= log

π1(xi) + + πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 23: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

23 PRINCIPAIS MODELOS ORDINAIS 9

em que j representa cada categoria ordenada da variaacutevel resposta e P (Yi = j|xi) = πj(xi) repre-

senta a probabilidade de ocorrecircncia da j-eacutesima categoria de resposta para um dado vetor xi de p

covariaacuteveis comsumc

j=1 πj(xi) = 1

2311 Modelo logito cumulativo com chances proporcionais

O Modelo logito cumulativo com chances proporcionais foi popularizado por Cullagh (1980) com

o nome de Modelo de chances proporcionais (proportional odds model) Entretanto Agresti (2010)

referiu-se a esse modelo por Modelo logito cumulativo com chances proporcionais (proportional

odds version of the cumulative logit model) devido agrave estrutura de chances proporcionais tambeacutem

poder ser utilizada para outros tipos de modelos como o Modelo logito categorias adjacentes ou

Modelo logito razatildeo contiacutenua

O Modelo logito cumulativo com chances proporcionais tem a seguinte forma

logito[P (Yi le j|xi)] = αj + βprimexi = αj + β1xi1 + β2xi2 + + βpxip j = 1 cminus 1 (22)

em que β = (β1 β2 βp)primeeacute um vetor de p paracircmetros desconhecidos xi denota o vetor dos valores

das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da variaacutevel

resposta Os interceptos αj satildeo tais que α1 lt α2 lt lt αj pois as probabilidades cumulativas

P (Yi le j) aumentam em j para cada valor fixo de xi

O Modelo logito cumulativo com chances proporcionais tem para cada logito cumulativo um

intercepto αj e o mesmo coeficiente angular β Este efeito comum implica que as probabilidades

cumulativas tecircm a mesma curvatura (mesma forma) Esse modelo liga os cminus 1 logitos a um uacutenico

modelo ou seja o modelo eacute mais simples de se interpretar do que se fossem ajustados cminus 1 modelos

separados

Para exemplificar considere esse modelo aplicado a uma variaacutevel resposta ordinal com c = 4

categorias ordinais e uma variaacutevel explanatoacuteria contiacutenua O paracircmetro β comum aos trecircs logitos

implica que a curva para as trecircs probabilidades cumulativas tem o mesmo formato conforme mostra

a Figura 21

Por vezes o Modelo logito cumulativo com chances proporcionais pode ser expresso por uma

parametrizaccedilatildeo alternativa que utiliza um sinal negativo precedendo βprimexi ou seja

logito[P (Yi le j|xi)] = αj minus βprimexi j = 1 cminus 1

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 24: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

10 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Figura 21 Probabilidades cumulativas no Modelo logito cumulativo com chances proporcionaisFonte Agresti (2010 p47)

Existem alguns softwares que utilizam esta parametrizaccedilatildeo como o SPSS (Corporation 2017) e

outros que utilizam a parametrizaccedilatildeo positiva como o SAS (SAS 2013) e o R (R Core Team 2017)

Para o caso de parametrizaccedilatildeo negativa outra forma de obter o sinal usual para a interpretaccedilatildeo do

modelo eacute expressar o modelo como

logito[P (Yi gt j|xi)] = logP (Yi gt j|xi)

1minus P (Yi gt j|xi)= αj + β

primexi j = 1 cminus 1

A estimaccedilatildeo dos paracircmetros do modelo pode ser realizada pelo meacutetodo de maacutexima verossimi-

lhanccedila A funccedilatildeo de verossimilhanccedila L eacute dada por

L =nprodi=1

cprodj=1

πj(xi)yij

=nprodi=1

cprodj=1

[P (Yi le j|xi)minus P (Y le j minus 1|xi)]yij

=

nprodi=1

cprodj=1

[exp(αj + β

primexi)

1 + exp(αj + βprimexi)minus exp(αjminus1 + β

primexi)

1 + exp(αjminus1 + βprimexi)

]yij

em que yij = 1 se a resposta do indiviacuteduo i i = 1 2 n estaacute na categoria j j = 1 2 c e yij = 0

caso contraacuterio comsump

j=1 yij = 1

Meacutetodos iterativos satildeo utilizados para obter os estimadores de maacutexima verossimilhanccedila Cullagh

(1980) e Walker e Duncan (1967) usaram o meacutetodo escore de Fisher A interpretaccedilatildeo do paracircmetro

β eacute anaacuteloga agrave do modelo de regressatildeo logiacutestica

Nos casos em que a suposiccedilatildeo de chances proporcionais natildeo eacute vaacutelida podem ser utilizados os

modelos descritos a seguir

2312 Modelo logito cumulativo com chances proporcionais parciais

Peterson e Harrell Jr (1990) propuseram o Modelo logito cumulativo com chances proporcionais

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 25: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

23 PRINCIPAIS MODELOS ORDINAIS 11

parcias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances

proporcionais e parte natildeo Esse modelo fica expresso por

logito[P (Yi le j|xi)] = αj + βprimexi + γ

prime

jzi j = 1 cminus 1

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi Entatildeo γj eacute definido como um incremente associado somente com o j-eacutesimo

logito cumulativo

Caso γj = 0 para todo j entatildeo esse modelo se reduz ao Modelo logito cumulativo com chances

proporcionais Quanto agrave estimaccedilatildeo dos paracircmetros desse modelo utiliza-se o meacutetodo de maacutexima

verossimilhanccedila

2313 Modelo logito cumulativo sem chances proporcionais

O Modelo logito cumulativo sem chances proporcionais permite diferentes efeitos para as

variaacuteveis explanatoacuterias

logito[P (Yi le j|xi)] = αj + βprime

jxi j = 1 cminus 1 (23)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)primedenota o vetor ptimes1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Segundo Agresti (2010) esse modelo eacute mais indicado quando natildeo houver variaacuteveis explanatoacuterias

contiacutenuas no modelo ou quando poucas observaccedilotildees forem registradas em uma categoria

232 Modelo logito categorias adjacentes

O logito categorias adjacentes eacute definido pelo logito da probabilidade condicional da resposta na

categoria j dada a resposta na categoria j ou j + 1

logito

[P (Yi = j|xi)

P (Yi = j|xi ou Yi = j + 1|xi)

]= logito

πj(xi)

πj(xi) + πj+1(xi)= log

πj(xi)

πj+1(xi) j = 1 cminus 1

Esse logito compara a categoria j com a categoria de referecircncia j+ 1 Entretanto eventualmente

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 26: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

12 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

eacute possiacutevel comparar a categoria j com outra categoria Normalmente utiliza-se a uacuteltima categoria

como referecircncia ou a mais comum Note que quando se utiliza a uacuteltima categoria como referecircncia

tem-se a seguinte equaccedilatildeo

logπj(xi)

πc(xi)= log

πj(xi)

πj+1(xi)+ log

πj+1(xi)

πj+2(xi)+ middot middot middot+ log

πcminus1(xi)

πc(xi) (24)

2321 Modelo logito categorias adjacentes com chances proporcionais

O Modelo logito categorias adjacentes com chances proporcionais eacute definido por

logπj(xi)

πj+1(xi)= αj + β

primexi j = 1 cminus 1 (25)

em que αj eacute um paracircmetro desconhecido β = (β1 β2 βp)prime

eacute um vetor p times 1 de paracircmetros

desconhecidos xi denota o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

e j representa cada categoria ordenada da variaacutevel resposta

Utilizando a categoria c como referecircncia conforme (24) o modelo tem a seguinte forma

logπj(xi)

πc(xi)=

cminus1sumk=j

αk + (cminus j)βprimexi j = 1 cminus 1

A versatildeo de chances proporcionais para o modelo logito de categorias adjacentes reconhece

a ordem das categorias da variaacutevel resposta e assume que as variaacuteveis explicativas tecircm o mesmo

efeito para as c categorias Similar ao que foi apresentado para o Modelo logito cumulativo com

chances proporcionais a estimaccedilatildeo dos paracircmetros eacute feita por maacutexima verossimilhanccedila

2322 Modelo logito categorias adjacentes com chances proporcionais parciais

O Modelo logito categorias adjacentes com chances proporcionais parciais da mesma maneira

que o Modelo logito cumulativo na Subseccedilatildeo 2312 permite uma estrutura simples para algumas

variaacuteveis explanatoacuterias em que eacute suposto que parte das variaacuteveis explanatoacuterias apresentam a

propriedade de chances proporcionais e parte natildeo Esse modelo eacute expresso por

logπj(xi)

πj+1(xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 27: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

23 PRINCIPAIS MODELOS ORDINAIS 13

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos associados agraves variaacuteveis

em xi xi denota o vetor ptimes1 de variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Com relaccedilatildeo agrave estimaccedilatildeo dos paracircmetros para este modelo tambeacutem eacute utilizado o meacutetodo de

maacutexima verossimilhanccedila

2323 Modelo logito categorias adjacentes sem chances proporcionais

O Modelo logito categorias adjacentes sem chances proporcionais permite diferentes efeitos para

as variaacuteveis explanatoacuterias o qual tem a seguinte forma

logπj(xi)

πj+1(xi)= αj + β

prime

jxi j = 1 cminus 1 (26)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor p times 1 de paracircmetros

desconhecidos e xi eacute o vetor dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

Segundo Agresti (2010) a escolha do modelo deve ser baseada em qual comparaccedilatildeo entre as

categorias da variaacutevel resposta eacute mais informativa para o problema

Como ilustraccedilatildeo suponha que haja interesse em analisar a relaccedilatildeo entre os graus da doenccedila renal

crocircnica (normal leve moderada e severa) e ter diabetes (sim e natildeo) O Modelo logito cumulativo

deve ser escolhido quando o interesse for avaliar a chance de um indiviacuteduo diabeacutetico natildeo ter a

doenccedila em relaccedilatildeo a apresentar insuficiecircncia renal (leve moderada ou severa) ou avaliar a chance

de um indiviacuteduo diabeacutetico natildeo ter a doenccedila ou apresentar insuficiecircncia renal leve em relaccedilatildeo agrave

insuficiecircncia renal moderada ou severa ou ainda avaliar a chance de um indiviacuteduo diabeacutetico natildeo

ter a doenccedila ou apresentar insuficiecircncia renal leve ou moderada em relaccedilatildeo agrave insuficiecircncia renal

severa Jaacute o Modelo logito categorias adjacentes deve ser escolhido quando o interesse for avaliar a

chance de um indiviacuteduo diabeacutetico natildeo ter a doenccedila em relaccedilatildeo agrave ter insuficiecircncia renal leve ou a

chance de um indiviacuteduo diabeacutetico ter insuficiecircncia renal leve em relaccedilatildeo agrave moderada ou a chance

de um indiviacuteduo diabeacutetico ter insuficiecircncia renal moderada em relaccedilatildeo agrave severa

233 Modelo logito razatildeo contiacutenua

O logito razatildeo contiacutenua eacute definido por

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 28: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

14 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

logito[wj(xi)] = logwj(xi)

(1minus wj(xi))= log

πj(xi)

πj+1(xi) + + πc(xi) j = 1 cminus 1

em que wj(xi) =P (Y = j|xi)

P (Y ge j|xi)=

πj(xi)

πj(xi) + + πc(xi)

ou

logito[wlowastj+1(xi)] = log

wlowastj+1(xi)

(1minus wlowastj+1(xi))

= logπj+1(xi)

π1(xi) + + πj(xi) j = 1 cminus 1

em que wlowastj+1(xi) =

P (Y = j + 1|xi)

P (Y le j + 1|xi)=

πj+1(xi)

π1(xi) + + πj+1(xi)

De acordo com Agresti (2010) os logitos razatildeo contiacutenua satildeo uacuteteis quando a variaacutevel Y for

caracterizada por um processo sequencial em que cada observaccedilatildeo deve passar pela categoria

resposta j antes de passar para uma categoria superior Por exemplo Tutz (1991) utilizou o Modelo

logito razatildeo contiacutenua para analisar a relaccedilatildeo entre o aumento de amiacutedala (natildeo ampliada ampliada

e grandemente ampliada) e ser portador ou natildeo de bacteacuterias Tutz (1991) argumentou que estes

dados formam um grupo sequencial pois a amiacutedala comeccedila no estaacutegio de natildeo ampliada e depois

torna-se ampliada

2331 Modelo logito razatildeo contiacutenua com chances proporcionais

Sendo a resposta Y caracterizada por um processo sequencial o Modelo logito razatildeo contiacutenua

com chances proporcionais pode ser expresso por

logπj(xi)

πj+1(xi) + + πc(xi)= αj + β

primexi j = 1 cminus 1 (27)

em que β = (β1 β2 βp)prime

eacute um vetor ptimes 1 de paracircmetros desconhecidos xi denota o vetor dos

valores das variaacuteveis explanatoacuterias para a observaccedilatildeo i e j representa cada categoria ordenada da

variaacutevel resposta

Procedimentos similares aos apresentados para os Modelos logitos cumulativos satildeo realizados

para os Modelos logitos razatildeo contiacutenua quanto agrave estimaccedilatildeo dos paracircmetros

2332 Modelo logito razatildeo contiacutenua com chances proporcionais parciais

Analogamente ao Modelo logito cumulativo da Subseccedilatildeo 2312 e ao Modelo logito categorias

adjacentes da Subseccedilatildeo 2322 o Modelo logito razatildeo contiacutenua com chances proporcionais parciais

supotildee que parte das variaacuteveis explanatoacuterias apresentam a propriedade de chances proporcionais e

parte natildeo Esse modelo pode ser expresso por

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 29: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

23 PRINCIPAIS MODELOS ORDINAIS 15

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

primexi + γ

primejzi j = 1 cminus 1

em que β = (β1 β2 βp)primeeacute um vetor ptimes1 de paracircmetros desconhecidos associados agraves variaacuteveis em

xi xi denota o vetor ptimes 1 das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo zi eacute um subgrupo

das p variaacuteveis explanatoacuterias (vetor qtimes 1 q lt p) para i-eacutesima observaccedilatildeo para o qual a suposiccedilatildeo de

chances proporcionais natildeo eacute vaacutelida e γj eacute um vetor q times 1 dos paracircmetros desconhecidos associados

agraves q variaacuteveis em zi

Quanto agrave estimaccedilatildeo dos paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimi-

lhanccedila

2333 Modelo logito razatildeo contiacutenua sem chances proporcionais

O Modelo logito razatildeo contiacutenua sem chances proporcionais eacute expresso por

logP (Yi = j|xi)

P (Yi gt j|xi)= αj + β

prime

jxi j = 1 cminus 1 (28)

em que αj eacute um paracircmetro desconhecido βj = (β1j β2j βpj)prime

eacute o vetor de p times 1 paracircmetros

desconhecidos e xi eacute o vetor ptimes 1 dos valores das variaacuteveis explanatoacuterias para a i-eacutesima observaccedilatildeo

Este modelo possui diferentes efeitos para as diferentes categorias Quanto agrave estimaccedilatildeo dos

paracircmetros para este modelo utiliza-se o meacutetodo de maacutexima verossimilhanccedila

Neste capiacutetulo foram apresentados os modelos de regressatildeo logiacutestica ordinal que fazem uso do

logito cumulativo logito categorias adjacentes e logito razatildeo contiacutenua Dentre os modelos expostos

o Modelo de regressatildeo logiacutestica ordinal mais utilizado na literatura eacute o Modelo logito cumulativo

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 30: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

16 MODELOS DE REGRESSAtildeO LOGIacuteSTICA ORDINAL 23

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 31: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

Capiacutetulo 3

Teacutecnicas de Diagnoacutestico

Neste capiacutetulo seratildeo apresentadas teacutecnicas de diagnoacutestico para verificar a adequabilidade dos

modelos de regressatildeo logiacutestica ordinal citados no Capiacutetulo 2 bem como meacutetodos para comparaccedilatildeo

de modelos e anaacutelise de resiacuteduos

31 Conceitos baacutesicos

Os modelos descritos no Capiacutetulo 2 permitem o uso de variaacuteveis explanatoacuterias categoacutericas e

contiacutenuas Quando se tem apenas variaacuteveis explanatoacuterias categoacutericas no modelo eacute possiacutevel formar

uma tabela de contingecircncia por meio das categorias da variaacutevel resposta e das combinaccedilotildees das

categorias das variaacuteveis explanatoacuterias

Suponha que em um modelo a variaacutevel resposta tenha c categorias ordinais as variaacuteveis

explanatoacuterias sejam todas categoacutericas e o nuacutemero de combinaccedilotildees dos niacuteveis dessas variaacuteveis

explanatoacuterias seja k Seja zl o vetor de valores das variaacuteveis explanatoacuterias que representa a l-eacutesima

combinaccedilatildeo l = 1 k A Tabela 31 exemplifica uma tabela de contingecircncia em que as k linhas

satildeo as combinaccedilotildees das categorias das variaacuteveis explanatoacuterias e as c colunas satildeo as categorias da

variaacutevel resposta O nuacutemero de indiviacuteduos em cada ceacutelula eacute denotado por nlj com nl =sum

j nlj

denotando a frequecircncia marginal da linha l l = 1 k e com n =sum

lj nlj denotando o total da

amostra Os valores das ceacutelulas satildeo a contagem das observaccedilotildees que pertencem agrave categoria de

resposta j e agrave combinaccedilatildeo l das categorias das variaacuteveis explanatoacuterias

Categorias de respostaCombinaccedilatildeo das categoriasdas variaacuteveis explanatoacuterias 1 2 c Total

1 n11 n12 n1c n1

2 n21 n22 n2c n2

k nk1 nk2 nkc nk

Tabela 31 Tabela de contingecircncia

A partir de cada modelo apresentado no Capiacutetulo 2 eacute possiacutevel estimar a probabilidade da

17

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 32: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

18 TEacuteCNICAS DE DIAGNOacuteSTICO 32

variaacutevel resposta assumir a categoria j para um dado vetor zl πlj = P (Y = j|zl) Por exemplo no

caso do Modelo logito cumulativo as probabilidades cumulativas satildeo expressas por

P (Y le j|zl) =eαj+β

primezl

1 + eαj+βprimezl j = 1 2 cminus 1

Logo

πlj = P (Y = j|zl) = P (Y le j|zl)minus P (Y le j minus 1|zl)

em quesum

j P (Y = j|zl) = 1

Com base nesta probabilidade o nuacutemero esperado Elj de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j e agrave combinaccedilatildeo l das variaacuteveis explanatoacuterias eacute dado por Elj = nlπlj

sendo πlj a estimativa de πlj obtida pelo modelo adotado

32 Testes da qualidade do ajuste do modelo

Nesta seccedilatildeo seratildeo apresentados testes para checar a adequabilidade dos modelos ajustados

321 Teste de Pearson e teste da razatildeo de verossimilhanccedilas

Nos casos em que a tabela de contingecircncia natildeo possui valores esparsos duas estatiacutesticas satildeo

usualmente utilizadas para testar a qualidade do ajuste de um modelo a estatiacutestica X2 de Pearson e

a estatiacutestica G2 da razatildeo de verossimilhanccedilas

Os testes comparam os valores observados na tabela de contingecircncia com as frequecircncias espera-

das estimadas com base no modelo ajustado A hipoacutetese nula equivale ao modelo proposto estar

bem ajustado

A estatiacutestica X2 de Pearson para testar a qualidade do ajuste do modelo eacute expressa por

X2 =suml

sumj

(nlj minus Elj)2

Elj

Jaacute a estatiacutestica G2 da razatildeo de verossimilhanccedilas tem a seguinte forma

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 33: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 19

G2 = 2suml

sumj

nljlognljElj

Sob a hipoacutetese nula X2 e G2 tecircm distribuiccedilatildeo assintoacutetica qui-quadrado (χ2) Segundo Agresti

(2010) o nuacutemero de graus de liberdade eacute igual ao nuacutemero de logitos menos o nuacutemero de paracircmetros

do modelo ajustado

Suponha por exemplo que o modelo proposto seja o Modelo logito cumulativo com chances

proporcionais com apenas uma variaacutevel explanatoacuteria com m (m ge 2) categorias O nuacutemero de

paracircmetros do modelo ajustado eacute igual ao nuacutemero de interceptos (αj) j = 1 cminus 1 mais os

mminus 1 paracircmetros associados a variaacutevel explanatoacuteria ou seja (cminus 1) + (mminus 1) paracircmetros Entatildeo o

nuacutemero de graus de liberdade para os testes eacute m(cminus 1)minus cminusm+ 2

Giolo (2017) adotou a seguinte expressatildeo para os graus de liberdade (kminus 1)(cminus 1)minus q em que

k eacute a combinaccedilatildeo dos niacuteveis das variaacuteveis explanatoacuterias c eacute o nuacutemero de categorias da variaacutevel

resposta e q eacute o nuacutemero de paracircmetros do modelo associados agraves variaacuteveis explanatoacuterias (natildeo leva

em conta os paracircmetros do intercepto αj) Esta expressatildeo eacute equivalente agrave expressatildeo utilizada por

Agresti (2010)

Para que a distribuiccedilatildeo das estatiacutesticas X2 e G2 tenha uma boa aproximaccedilatildeo pela distribuiccedilatildeo

χ2 pelo menos 80 dos valores esperados devem ser maiores que 5 (Freeman Jr 1987)

De acordo com Agresti (1996) quando o modelo conteacutem um preditor contiacutenuo os testes X2 e

G2 natildeo satildeo vaacutelidos pois cada valor deste preditor contiacutenuo representaria uma categoria e o nuacutemero

de combinaccedilotildees k das categorias da variaacuteveis explanatoacuterias seria muito grande com a provaacutevel

ocorrecircncia de valores esparsos

Nas proacuteximas subseccedilotildees seratildeo apresentados quatro testes para checar a qualidade do ajuste

de modelos de regressatildeo logiacutestica ordinais com chances proporcionais Modelo logito cumulativo

Modelo logito categorias adjacentes e Modelo logito razatildeo contiacutenua que devem ser utilizados

quando haacute valores esparsos ou quando haacute preditores contiacutenuos no modelo Uma opccedilatildeo para checar

a qualidade do ajuste de modelos de regressatildeo logiacutestica ordinais sem chances proporcionais e

que tenham variaacuteveis explicativas contiacutenuas no modelo seria categorizar as variaacuteveis explicativas

contiacutenuas e aplicar os meacutetodos utilizados quando se tem apenas variaacuteveis explanatoacuterias categoacutericas

no modelo

Estes testes encontram-se implementados em vaacuterios sofwares tais como R e SAS

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 34: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

20 TEacuteCNICAS DE DIAGNOacuteSTICO 32

322 Teste de Lipsitz

O teste de Lipsitz et al (1996) eacute baseado parcialmente no teste de Hosmer e Lemeshow (1980)

utilizado para verificar a qualidade do ajuste de modelos de regressatildeo logiacutestica com resposta binaacuteria

Suponha uma amostra de n observaccedilotildees independentes (xi yi) i = 1 n Denote πij =

P (Yi = j|xi) Assim πij eacute a probabilidade estimada de cada categoria da variaacutevel resposta para

cada xi Primeiramente calcula-se a probabilidade estimada pelo modelo de regressatildeo ordinal

ajustado (πij) Depois atribui-se um escore (si) para cada observaccedilatildeo usando pesos igualmente

espaccedilados

si = πi1 + 2πi2 + + cπic i = 1 n (31)

Depois de atribuiacutedos os escores ordenam-se as observaccedilotildees com base nos escores obtidos e

formam-se g grupos de modo que o 1 grupo contenha as ng observaccedilotildees com os menores escores

e o grupo g tenha as ng observaccedilotildees com os maiores escores Apoacutes a criaccedilatildeo dos grupos criam-se

g minus 1 variaacuteveis indicadoras binaacuterias da seguinte forma

Iiv =

1 se a observaccedilatildeo i estaacute no grupo v

0 caso contraacuterio

para i = 1 n e v = 1 g minus 1

Entatildeo ajusta-se um novo modelo de regressatildeo ordinal que inclua as variaacuteveis indicadoras

hij = αj + βprimex+

gminus1sumv=1

γvIv j = 1 cminus 1

em que hij representa a funccedilatildeo de ligaccedilatildeo relacionada ao modelo proposto

De acordo com o Capiacutetulo 2 para o Modelo logito cumulativo com chances proporcionais

hij = logπ1(xi) + + πj(xi)

πj+1(xi) + + πc(xi)

Jaacute para o Modelo categorias adjacentes com chances proporcionais

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 35: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 21

hij = logπj(xi)

πj+1(xi)

e para o Modelo logito razatildeo contiacutenua com chances proporcionais

hij = logπj(xi)

πj+1(xi) + + πc(xi)

A princiacutepio outras funccedilotildees de ligaccedilatildeo aleacutem da funccedilatildeo de ligaccedilatildeo logito podem ser usadas tais

como a ligaccedilatildeo probito ou a ligaccedilatildeo complemento log-log

Pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald ou a estatiacutestica

escore para testar

H0 γ1 = = γgminus1 = 0

Se H0 natildeo for rejeitada haacute a indicaccedilatildeo de que o modelo adotado estaacute corretamente especificado

Denotemos L0 e L1 como o logaritmo da funccedilatildeo de verossimilhanccedila do modelo ajustado sem e

com as variaacuteveis indicadoras respectivamente O valor-p do teste associado agrave estatiacutestica da razatildeo de

verossimilhanccedilas eacute obtido aproximando-se a estatiacutestica minus2(L0 minus L1) pela distribuiccedilatildeo χ2 com g minus 1

graus de liberdade

De acordo com Lipsitz et al (1996) a estatiacutestica minus2(L0 minus L1) pode ser escrita como uma

combinaccedilatildeo linear da diferenccedila (Ovj minus Evj) em que Ovj =sumn

i=1 IivYij eacute o nuacutemero de observaccedilotildees

da variaacutevel resposta pertencentes agrave categoria j e ao grupo v e Evj =sumn

i=1 Iivπij eacute o nuacutemero

esperado de observaccedilotildees da variaacutevel resposta pertencentes agrave categoria j e ao grupo v

Para se garantir que a estatiacutestica do teste tenha distribuiccedilatildeo aproximadamente χ2 com g minus 1

graus de liberdade a amostra deve ser grande Espera-se que o nuacutemero esperado de indiviacuteduos na

categoria de resposta j seja maior que 1 em cada um dos g grupos e que em pelo menos 80 dos g

grupos o nuacutemero esperado seja maior que 5 (Freeman Jr 1987) Para situaccedilotildees em que isso natildeo

acontece a aproximaccedilatildeo χ2 pode ser pobre

Uma soluccedilatildeo possiacutevel para a situaccedilatildeo de amostra pequena eacute usar um nuacutemero pequeno de grupos

Na aproximaccedilatildeo de Hosmer e Lemeshow (1980) para dados binaacuterios eacute recomendado formar 10

grupos (g = 10) de tamanhos aproximadamente iguais Lipsitz et al (1996) sugerem que o nuacutemero

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 36: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

22 TEacuteCNICAS DE DIAGNOacuteSTICO 32

de grupos seja escolhido no intervalo 6 le g lt n

5c

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata (Stata et al 2017) para o Modelo logito categorias adjacentes com chances

proporcionais e para o Modelo logito razatildeo contiacutenua com chances proporcionais

323 Teste de Pulkstenis-Robinson

Pulkstenis e Robinson (2004) apresentaram uma modificaccedilatildeo das estatiacutesticas X2 de Pearson e

G2 da razatildeo de verossimilhanccedilas para ser utilizada quando preditores contiacutenuos e categoacutericos estatildeo

presentes simultaneamente no modelo

Primeiramente satildeo determinadas as combinaccedilotildees das variaacuteveis que seratildeo utilizadas usando

somente as variaacuteveis categoacutericas do modelo em que as categorias natildeo observadas satildeo desconsidera-

das Em seguida calculam-se os escores da mesma maneira que em (31) e entatildeo cada combinaccedilatildeo

l das variaacuteveis explanatoacuterias eacute dividida em duas com base na mediana dos escores pertencentes a

cada combinaccedilatildeo Eacute construiacuteda uma tabela com as frequecircncias observadas e estimadas e a partir

desta tabela eacute obtida a estatiacutestica modificada de Pearson e da razatildeo de verossimilhanccedilas por meio

das foacutermulas descritas abaixo respectivamente

X2PR =

ksuml=1

2sumt=1

csumj=1

(nltj minus Eltj)2

Eltj

G2PR =

ksuml=1

2sumt=1

csumj=1

nltjlognltjEltj

em que l representa as combinaccedilotildees das variaacuteveis explanatoacuterias t representa os dois subgrupos

baseados nos escores ordinais j representa as categorias da variaacutevel resposta nltj representa o

nuacutemero de indiviacuteduos pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias

e ao t-eacutesimo subgrupo e Eltj representa o nuacutemero esperado de observaccedilotildees da variaacutevel resposta

pertencentes agrave categoria j agrave l-eacutesima combinaccedilatildeo das variaacuteveis explanatoacuterias e ao t-eacutesimo subgrupo

ou seja eacute a soma das probabilidades estimadas pelo modelo ajustado para as nlt =sumc

j=1 nltj

observaccedilotildees

As duas estatiacutesticas seguem uma distribuiccedilatildeo χ2 com (2kminus1)(cminus1)minusmminus1 graus de liberdadeem

que 2k eacute o nuacutemero de linhas da tabela de contingecircncia c eacute o nuacutemero de categorias da variaacutevel

resposta m eacute o nuacutemero de termos categoacutericos do modelo e foi subtraiacutedo um grau de liberdade

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 37: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

32 TESTES DA QUALIDADE DO AJUSTE DO MODELO 23

devido a contribuiccedilatildeo das variaacuteveis contiacutenuas Por exemplo caso fosse ajustado um modelo com

uma variaacutevel explanatoacuteria dicotocircmica e outra variaacutevel explanatoacuteria categoacuterica com quatro niacuteveis

entatildeo m = 4 A fim de garantir que a estatiacutestica do teste tenha a distribuiccedilatildeo aproximada χ2 foi

sugerido que a maioria (80) dos valores esperados seja maior que 5

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

324 Versatildeo ordinal do teste de Hosmer-Lemeshow

Para desenvolver este teste Fagerland e Hosmer (2013) basearam-se no teste de Hosmer -

Lemeshow para regressatildeo logiacutestica binaacuteria Assim como nos outros testes calcula-se a probabilidade

estimada do modelo de regressatildeo ordinal ajustado (πij) e atribui-se um escore (si) para cada

observaccedilatildeo como em (31)

A seguir ordenam-se as observaccedilotildees com base nos escores obtidos e formam-se g grupos de

modo que o 1 grupo contenha as observaccedilotildees com os ng menores escores e o grupo g tenha

as ng observaccedilotildees com os maiores escores Foi sugerido formar 10 grupos (g = 10) de tamanhos

aproximadamente iguais assim como na aproximaccedilatildeo de Hosmer-Lemeshow para dados binaacuterios

Constroacutei-se entatildeo uma tabela de contingecircncia com g linhas e c colunas conforme mostra a

Tabela 32 em que nvj representa o nuacutemero de observaccedilotildees pertencentes ao v-eacutesimo grupo e agrave

j-eacutesima categoria da resposta e Evj representa o nuacutemero esperado de observaccedilotildees pertencentes

ao v-eacutesimo grupo e agrave j-eacutesima categoria da resposta conforme definido na Seccedilatildeo 322 A versatildeo

ordinal da estatiacutestica do teste de Hosmer-Lemeshow eacute dada por

Cg =

gsumv=1

csumj=1

(nvj minus Evj)2

Evj

A distribuiccedilatildeo de Cg eacute aproximadamente χ2 com (g minus 2)(c minus 1) + (c minus 2) graus de liberdade

em que (g minus 2)(cminus 1) eacute referente ao teste de Hosmer-Lemeshow binaacuterio e (cminus 2) eacute uma correccedilatildeo

feita para refletir o fato de que a soma das frequecircncias estimadas natildeo eacute igual agrave das observadas em

cada um dos c niacuteveis da resposta Um grau de liberdade eacute perdido por conta da ordenaccedilatildeo dos

interceptos

Este teste encontra-se implementado no R por meio do pacote generalhoslem para o Modelo

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 38: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

24 TEacuteCNICAS DE DIAGNOacuteSTICO 32

Categorias de respostaGrupo 1 2 c Total

1 n11 n12 n1c n12 n21 n22 n2c n2 g ng1 ng2 ngc ng

Tabela 32 Frequecircncias observadas

logito cumulativo com chances proporcionais Atualmente este teste tambeacutem foi implementado

no software Stata para o Modelo logito categorias adjacentes com chances proporcionais e para o

Modelo logito razatildeo contiacutenua com chances proporcionais

325 Comparaccedilatildeo entre os testes

Fagerland e Hosmer (2013) examinaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito cumulativo com chances proporcionais para seis diferentes tipos de situaccedilotildees

Jaacute Fagerland e Hosmer (2016) avaliaram o poder do teste de Lipsitz da versatildeo ordinal do teste

Hosmer-Lemeshow e dos testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

para o Modelo logito categorias adjacentes e para o Modelo logito razatildeo contiacutenua com chances

proporcionais em oito diferentes tipos de situaccedilotildees A seguir seratildeo apresentados os resultados

obtidos nos artigos supramencionados

No Modelo logito cumulativo com chances proporcionais os testes natildeo apresentaram bom poder

para detectar omissatildeo do termo quadraacutetico O teste Lipsitz foi o que apresentou melhor performance

entretanto para obter um poder maior que 50 eacute preciso ter uma amostra grande e um termo

quadraacutetico influente Jaacute nos Modelos logito categorias adjacentes e razatildeo contiacutenua o teste de Lipsitz

obteve poder maior do que a versatildeo ordinal do teste de Hosmer-Lemeshow para detectar a omissatildeo

de termo quadraacutetico da variaacutevel explanatoacuteria contiacutenua enquanto os testes de Pulkstenis-Robinson

obtiveram poder baixo

Os quatro testes obtiveram poder maior que 90 para detectar a falta do termo de interaccedilatildeo

tanto entre uma variaacutevel explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica

quanto entre duas variaacuteveis explanatoacuterias categoacutericas dicotocircmicas no Modelo logito cumulativo com

chances proporcionais Os testes Lipsitz e Pulkstenis-Robinson apresentaram maior poder do que a

versatildeo ordinal do teste Hosmer-Lemeshow

Todos os testes obtiveram excelente poder para detectar a falta de interaccedilatildeo entre uma variaacutevel

explanatoacuteria contiacutenua e uma variaacutevel explanatoacuteria categoacuterica dicotocircmica para os modelos logito

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 39: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

33 TESTE DE PROPORCIONALIDADE 25

categorias adjacentes e logito razatildeo contiacutenua

Para o Modelo logito categorias adjacentes todos os testes apresentaram bom poder para

detectar a falta de interaccedilatildeo entre duas variaacuteveis explanatoacuterias dicotocircmicas Jaacute para o Modelo logito

razatildeo contiacutenua os testes de Pulkstenis-Robinson apresentaram excelente poder enquanto os testes

Lipsitz e Hosmer-Lemeshow obtiveram poder menor

Nenhum dos quatro testes detectou erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua quando o

Modelo logito cumulativo com chances proporcionais foi ajustado com o termo x ao inveacutes de log(x)

Para o Modelo logito categorias adjacentes a versatildeo ordinal do teste Hosmer-Lemeshow apre-

sentou poder baixo a moderado para detectar erro na funccedilatildeo da variaacutevel explanatoacuteria contiacutenua

enquando o teste Lipsitz apresentou poder moderado a bom e os testes de Pulkstenis-Robinson

apresentaram fraco poder No Modelo logito razatildeo contiacutenua a versatildeo ordinal do teste Hosmer-

Lemeshow apresentou poder baixo o teste Lipsitz apresentou poder baixo a moderado e os testes

de Pulkstenis-Robinson apresentaram poder baixo

Para o Modelo logito cumulativo com chances proporcionais os testes de Pulkstenis-Robinson e

a versatildeo ordinal do teste de Hosmer-Lemeshow apresentaram boa performance para detectar a falta

de proporcionalidade do modelo enquanto o teste Lipsitz natildeo apresentou

O poder de todos os testes foi baixo para verificar a falta de uma variaacutevel explanatoacuteria indepen-

dente para os Modelos logito categorias adjacentes e razatildeo contiacutenua

Fagerland e Hosmer (2013) e Fagerland e Hosmer (2016) recomendaram usar os quatro tipos

de testes visto que os quatro testes podem exibir poderes diferentes dependendo do tipo de

falta de ajuste Por conta do poder ser geralmente baixo para amostras de tamanho pequeno foi

recomendado usar um niacutevel de significacircncia de 10 caso a amostra seja menor que 400

33 Teste de proporcionalidade

Uma caracteriacutestica dos modelos com estrutura de chances proporcionais eacute que o efeito das

variaacuteveis explanatoacuterias eacute o mesmo para cada um dos c-1 logitos Assim eacute de interesse verificar a

propriedade de chances proporcionais O teste de proporcionalidade estaacute associado agraves hipoacuteteses

H0 o modelo e dado por 22 25 ou 27 (modelos com chances proporcionais) (32)

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 40: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

26 TEacuteCNICAS DE DIAGNOacuteSTICO 35

versus

H1 o modelo e dado por 23 26 ou 28 (modelos sem chances proporcionais) (33)

Para testar H0 pode-se utilizar a estatiacutestica da razatildeo de verossimilhanccedilas a estatiacutestica de Wald

proposta por Brant (1990) ou a estatiacutestica escore proposta por Peterson e Harrell Jr (1990)

A estatiacutestica do teste da razatildeo de verossimilhanccedilas eacute dada por minus2(L0 minus L1) em que L0 e L1

denotam o logaritmo da funccedilatildeo de verossimilhanccedila do modelo em (32) e (33) respectivamente

Este teste segue aproximadamente a distribuiccedilatildeo qui-quadrado (χ2) O nuacutemero de graus de

liberdade equivale agrave diferenccedila entre o nuacutemero de paracircmetros do modelo sob a hipoacutetese alternativa

e o nuacutemero de paracircmetro do modelo proposto ou seja o modelo em (33) tem p(cminus 1) paracircmetros

associados agraves p variaacuteveis explanatoacuterias enquanto o modelo em (32) tem p paracircmetros associados

agraves p variaacuteveis explanatoacuterias Logo o nuacutemero de graus de liberdade eacute p(cminus 2)

Segundo Agresti (2010) quando natildeo for possiacutevel ajustar o modelo mais complexo o que

acontece por vezes no Modelo logito cumulativo sem chances proporcionais eacute possiacutevel utilizar o

teste escore visto que este teste compara os modelos usando o log da funccedilatildeo de verossimilhanccedila

somente sob a hipoacutetese nula Jaacute quando for possiacutevel ajustar o modelo mais complexo aleacutem do teste

da razatildeo de verossimilhanccedilas eacute tambeacutem possiacutevel utilizar o teste de Wald

Kim (2003) sugeriu plotar as probabilidades estimadas obtidas sob a estrutura do modelo

proporcional contra as probabilidades estimadas no modelo que permite diferentes efeitos Em

termos praacuteticos a falta de ajuste natildeo eacute severa se os pares de de probabilidades estimadas caem

proacuteximos da linha de intercepto 0 e declive 1

34 Anaacutelise de resiacuteduos

Uma maneira alternativa de checar a falta de ajuste quando se tem apenas variaacuteveis explanatoacuterias

categoacutericas no modelo eacute por meio da anaacutelise de resiacuteduos Para uma tabela de contingecircncia com

o valor da ceacutelula nlj e nuacutemero esperado Elj = nlπlj para a l-eacutesima combinaccedilatildeo das variaacuteveis

explanatoacuterias e categoria resposta j o resiacuteduo padronizado eacute

rlj =nlj minus nlπljradicnlπlj [1minus πlj ]

Os resiacuteduos padronizados tecircm distribuiccedilatildeo aproximadamente normal padratildeo Valores grandes

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 41: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

36 CRITEacuteRIO DE INFORMACcedilAtildeO AKAIKE 27

como excedendo 3 em valor absoluto indicam falta de ajuste na ceacutelula

35 Criteacuterio de informaccedilatildeo Akaike

Outra maneira que pode ajudar a selecionar um bom modelo eacute utilizar o meacutetodo proposto por

Akaike (1974) o qual eacute um processo de minimizaccedilatildeo e natildeo envolve testes estatiacutesticos

O criteacuterio de informaccedilatildeo de Akaike (Akaike information criterion - AIC) consiste em encontrar

um modelo tal que a quantidade abaixo seja minimizada

AIC = minus2(logL(θ)minus p)

em que θ eacute o vetor de paracircmetros do modelo proposto L(θ) eacute o logariacutetimo da funccedilatildeo de verossi-

milhanccedila avaliado na estimativa de maacutexima verossimilhanccedila de θ e p o nuacutemero de paracircmetros do

modelo

Agresti (2010) mencionou que as variaacuteveis explanatoacuterias ordinais podem ser tratadas como

quantitativas uma vez que escores numeacutericos sejam atribuiacutedos agraves categorias Como o meacutetodo AIC

penaliza o modelo que tem mais paracircmetros ele deve ser usado com cautela na escolha de um

modelo que utiliza variaacuteveis explanatoacuterias categoacutericas como quantitativas

36 Meacutetodo de seleccedilatildeo

Para selecionar variaacuteveis em um modelo podemos utilizar um dos meacutetodos de seleccedilatildeo como

stepwise forward ou backward ou utilizar o meacutetodo AIC

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 42: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

28 TEacuteCNICAS DE DIAGNOacuteSTICO 36

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 43: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

Capiacutetulo 4

Aplicaccedilotildees

41 Dados utilizados

Os dados que ilustram este trabalho foram coletados em uma Unidade de Referecircncia Especiali-

zada (URE) do serviccedilo puacuteblico na cidade de Beleacutem-PA no periacuteodo de junho de 2016 a fevereiro

de 2017 (Magrini 2015) Este estudo tem como objetivo investigar a relaccedilatildeo entre perda auditiva

equiliacutebrio e aspectos emocionais no idoso

Os dados referem-se a 138 indiacuteviduos com idade superior a 60 anos e com perda auditiva As va-

riaacuteveis demograacuteficas incluem informaccedilotildees quanto ao sexo (1=masculino 2=feminino) escolaridade

(0=analfabeto 1=ensino fundamental 2=ensino meacutedio 3=graduaccedilatildeo) renda mensal (1=sem

renda 2=1 salaacuterio miacutenimo 3=maior que 1 a 2 salaacuterios miacutenimos 4=maior que 2 salaacuterios miacutenimos)

e idade (em anos)

Para avaliar a depressatildeo foi utilizada a Escala de Depressatildeo Geriaacutetrica formada com 15 perguntas

afirmativas e negativas em que o resultado de cinco ou mais pontos caracteriza o diagnoacutestico de

depressatildeo (0=natildeo 1=sim)

Foram feitas perguntas de auto referecircncia sobre audiccedilatildeo como quando a famiacutelia comeccedilou a

perceber o problema de audiccedilatildeo contendo as respostas 6 meses (coacutedigo 1) 1 ano (coacutedigo 2) 2 anos

(coacutedigo 3) e mais de dois anos (coacutedigo 4)

Foram realizados testes de equiliacutebrio estaacutetico dinacircmico e de mobilidade entre eles a prova de

Unterberg com olhos abertos Esta prova consiste em o paciente executar movimento de marcha

sem sair do lugar e braccedilos estendidos agrave sua frente Considerou-se positivo (coacutedigo 1) caso o idoso

conseguisse realizar a prova e negativo (coacutedigo 0) se ele natildeo conseguisse realizar

Outro teste de equiliacutebrio estaacutetico dinacircmico e de mobilidade realizado pelos idosos foi a prova

Time Up and Go (TUG) que consiste em cronometrar o tempo que o paciente leva para se levantar

de uma cadeira fazer um percurso de trecircs metros e voltar a sentar na cadeira O resultado com

tempo menor que 11 segundos (coacutedigo 1) eacute considerado normal satildeo idosos independentes e sem

risco de quedas entre 11 e 20 segundos (coacutedigo 2) satildeo idosos que apresentam independecircncia

29

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 44: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

30 APLICACcedilOtildeES 42

parcial e com baixo risco de quedas e o tempo acima de 20 segundos (coacutedigo 3) satildeo idosos que

apresentam deacuteficits importantes de mobilidade fiacutesica e risco de quedas

Por uacuteltimo foi realizada uma auto avaliaccedilatildeo sobre audiccedilatildeo por meio da pergunta em geral vocecirc

diria que sua audiccedilatildeo eacute ruim (coacutedigo 1) regular (coacutedigo 2) boa (coacutedigo 3) muito boa (coacutedigo 4) e

excelente (coacutedigo 5) As categorias muito boa e excelente foram desconsideradas em virtude de natildeo

haver esses resultados na amostra

Para este estudo foram consideradas como variaacuteveis explanatoacuterias as variaacuteveis sexo escolaridade

renda mensal idade depressatildeo quando a famiacutelia comeccedilou a perceber e prova de Unterberg com

olhos abertos As variaacuteveis respostas consideradas foram a prova Time Up and Go e em geral vocecirc

diria que sua audiccedilatildeo eacute Para o modelo que considerou como variaacutevel resposta a prova Time Up

and Go utilizaram-se as variaacuteveis explanatoacuterias supracitadas com exceccedilatildeo da variaacutevel prova de

Unterberg com olhos abertos que natildeo era de interesse no estudo

No Apecircndice A encontra-se a distribuiccedilatildeo conjunta entre as variaacuteveis explanatoacuterias e cada uma

das variaacuteveis respostas

42 Anaacutelise inferencial

Para ilustrar algumas aplicaccedilotildees com este banco de dados optou-se por ajustar o Modelo logito

cumulativo com chances proporcionais para a variaacutevel prova Time Up and Go e o Modelo logito

categorias adjacentes com chances proporcionais para a variaacutevel em geral vocecirc diria que sua audiccedilatildeo

eacute Utilizou-se o software R para fazer as anaacutelises O teste de Lipsitz a versatildeo ordinal do teste de

Hosmer-Lemeshow e os testes qui-quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson

estatildeo implementados neste software por meio do pacote generalhoslem para o Modelo logito

cumulativo com chances proporcionais Como estes testes ainda natildeo encontram-se implementados

para o Modelo logito categorias adjacentes com chances proporcionais estes foram desenvolvidos

nesta dissertaccedilatildeo Nas anaacutelises adotou-se o nuacutemero de grupos igual a seis (g = 6) para o teste de

Lipsitz e para a versatildeo ordinal do teste de Hosmer-Lemeshow Utilizou-se o niacutevel de significacircncia de

10 para a seleccedilatildeo das variaacuteveis explanatoacuterias

421 Prova Time Up and Go

Para a variaacutevel prova Time Up and Go ajustou-se o Modelo logito cumulativo com chances

proporcionais considerando-se duas situaccedilotildees na primeira as variaacuteveis explanatoacuterias com mais de

duas categorias foram tratadas como quantitativas e na segunda como qualitativas

Para a primeira situaccedilatildeo a Tabela 41 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 45: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

42 ANAacuteLISE INFERENCIAL 31

quadrado e da razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do

ajuste do modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela

evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 6 96 5 0 224

Hosmer-Lemeshow 10 94 9 0 280X2PR 10 79 11 0 461

G2PR 13 89 11 0 239

Tabela 41 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 1

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 328)

A Tabela 42 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 3 8843 2 0056 0 053Intercepto 2 α2 8 2238 2 1551 lt 0 001

Idade γ1 minus0 1034 0 0276 lt 0 001Renda mensal γ2 0 9283 0 2697 0 001

Tabela 42 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 1

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1034Z1 + 0 9283Z2 j = 1 2

em que Z1 representa a idade em anos Z2 = 1 se o idoso natildeo tem renda Z2 = 2 se o idoso tem

renda mensal de 1 salaacuterio miacutenimo Z2 = 3 se o idoso tem renda maior que 1 salaacuterio a 2 salaacuterios

miacutenimos e Z2 = 4 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal igual a z2 salaacuterios miacutenimos demorar

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 46: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

32 APLICACcedilOtildeES 42

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 2 53 vezes a

chance de um idoso com renda mensal igual a (z2 minus 1) salaacuterios miacutenimos demorar menos que

11 segundos para realizar a prova

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas

como qualitativas A Tabela 43 apresenta os valores das estatiacutesticas os graus de liberdade e os

valores-p do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste do

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 3 45 5 0 630

Hosmer-Lemeshow 4 79 9 0 852

Tabela 43 Testes de qualidade do ajuste - Prova Time Up and Go - situaccedilatildeo 2

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram idade (Z1) e renda mensal (Z2)

Para avaliar a validade da suposiccedilatildeo de chances proporcionais para as duas variaacuteveis explanatoacute-

rias que obtiveram efeito significativo aplicou-se o teste de proporcionalidade O teste mostrou que

o Modelo logito cumulativo com chances proporcionais parece adequado (valor-p = 0 147)

A Tabela 44 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 4 8272 1 9805 0 015Intercepto 2 α2 9 1651 2 1487 lt0 001

Idade γ1 minus0 1053 0 0287 lt 0 001Renda mensal de 1 salaacuterio miacutenimo γ2 1 1229 0 8359 0 179

Renda mensal gt 1 a 2 salaacuterios miacutenimos γ3 1 6628 0 9195 0 075Renda mensal gt 2 salaacuterios miacutenimos γ4 3 1578 1 0254 0 002

Tabela 44 Estimativas dos paracircmetros do modelo final - Prova Time Up and Go - situaccedilatildeo 2

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[P (Yi le j|zi)

1minus P (Yi le j|zi)

]= αj minus 0 1053Z1 + 1 1229Z2 + 1 6628Z3 + 3 1578Z4 j = 1 2

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 47: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

42 ANAacuteLISE INFERENCIAL 33

em que Z1 representa a idade em anos Z2 = 1 se o idoso tem renda mensal de 1 salaacuterio miacutenimo

Z2 = 0 caso contraacuterio Z3 = 1 se o idoso tem renda mensal maior que 1 a 2 salaacuterios miacutenimos

Z3 = 0 caso contraacuterio e Z4 = 1 se o idoso tem salaacuterio maior que 2 salaacuterios miacutenimos Z4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a renda mensal a chance de um idoso com z1 anos demorar menos que 11 segundos

para realizar a prova Time Up and Go eacute exp (γ1) = 0 90 vezes a chance de um idoso com

(z1 minus 1) anos demorar menos que 11 segundos para realizar a prova

bull fixada a idade a chance de um idoso com renda mensal de 1 salaacuterio miacutenimo demorar menos

do que 11 segundos para realizar a prova Time Up and Go eacute exp (γ2) = 3 07 vezes a chance

de um idoso que natildeo tenha renda demorar menos de 11 segundos para realizar a prova Time

Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacute-

rios miacutenimos demorar menos que 11 segundos para realizar a prova Time Up and Go eacute

exp (γ3 minus γ2) = 1 72 vezes a chance de um idoso que tenha renda mensal de 1 salaacuterio miacutenimo

demorar menos que 11 segundos para realizar a prova Time Up and Go

bull fixada a idade a chance de um idoso com renda mensal maior que 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go eacute exp (γ4 minus γ3) = 4 46 vezes

a chance de um idoso com renda mensal maior que 1 salaacuterio a 2 salaacuterios miacutenimos demorar

menos que 11 segundos para realizar a prova Time Up and Go

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto agrave chance de um idoso demorar ateacute 20 segundos para realizar

a prova Time Up and Go

Finalmente utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo conside-

rando as variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que

considera as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 45 nota-se que o menor

AIC foi para o modelo mais simples o qual considera as variaacuteveis explanatoacuterias com mais de duas

categorias como quantitativas Entretanto este meacutetodo deve ser utilizado com cautela uma vez

que este criteacuterio favorece o modelo mais simples pois penaliza o modelo com mais paracircmetros

Por fim ajustou-se o Modelo logito categorias adjacentes com chances proporcionais para as

mesmas variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significa-

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 48: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

34 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 20403

Modelo (quantitativa) 19944

Tabela 45 AIC dos modelos ajustados - Prova Time Up and Go

tivas tanto para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias

como quantitativas quanto para o modelo que considera como qualitativas

422 Em geral vocecirc diria que sua audiccedilatildeo eacute

Para a variaacutevel em geral vocecirc diria que a sua audiccedilatildeo eacute ajustou-se o Modelo logito categorias

adjacentes com chances proporcionais considerou-se duas situaccedilotildees na primeira as variaacuteveis

explanatoacuterias com mais de duas categorias foram tratadas como quantitativas e na segunda como

qualitativas

Para a primeira situaccedilatildeo a Tabela 46 apresenta os valores das estatiacutesticas os graus de liberdade

e os valores-p do teste de Lipsitz da versatildeo ordinal do teste Hosmer-Lemeshow e dos testes qui-

quadrado e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste

do modelo completo contendo todas as variaacuteveis explanatoacuterias Com exceccedilatildeo do teste X2PR os

resultados dessa tabela evidenciam o bom ajuste do modelo completo

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 46 5 0 486

Hosmer-Lemeshow 9 05 9 0 432X2PR 33 27 22 0 058

G2PR 12 55 22 0 293

Tabela 46 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor p = 0 179)

Excluindo a variaacutevel prova de Unterberg com olhos abertos que como mostra a Tabela A11

apresenta 93 5 de respostas negativas todos os testes de qualidade do ajuste apresentaram

valores-p superiores a 10

Para a seleccedilatildeo das variaacuteveis utilizou-se o meacutetodo backward A variaacutevel explanatoacuteria que obteve

efeito significativo foi a variaacutevel depressatildeo (X1)

A Tabela 47 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para o

modelo final ajustado

O modelo final ajustado pode ser expresso em termos dos logitos por

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 49: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

42 ANAacuteLISE INFERENCIAL 35

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor pIntercepto 1 α1 minus0 6427 0 2785 0 021Intercepto 2 α2 1 8990 0 3942 lt 0 001Depressatildeo β1 0 5927 0 3096 0 056

Tabela 47 Estimativas dos paracircmetros do modelo final adotado

log

[P (Yi = j|xi)

P (Yi = j + 1|xi)

]= αj + 0 5927X1 j = 1 2

em que X1 = 0 se o idoso natildeo tem depressatildeo e X1 = 1 se o idoso tem depressatildeo

Em virtude do modelo final natildeo ter variaacuteveis contiacutenuas utilizou-se a estatiacutestica de Pearson (X2)

e a razatildeo de verossimilhanccedilas (G2) para verificar a qualidade do ajuste desse modelo Os resultados

dos testes de qualidade do ajuste podem ser vistos na Tabela 48 indicando evidecircncias a favor do

modeloTeste Valor da estatiacutestica Graus de liberdade valor p

Pearson (X2) 1 56 1 0 212Razatildeo de Verossimilhanccedilas (G2) 1 56 1 0 212

Tabela 48 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1 - modelo final

A Figura 41 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo com as categorias da variaacutevel resposta Como os valores situam-se em torno

de zero haacute evidecircncias a favor do modelo

Figura 41 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 1

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute

exp (β1) = 1 8 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave regular

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 50: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

36 APLICACcedilOtildeES 42

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados a

mesma conclusatildeo eacute obtida quanto agrave chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo pode ser expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5927(3minus j)X1 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo

Quanto agrave interpretaccedilatildeo tem-se que

bull a chance de um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute

exp (2β1) = 3 3 vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute

ruim em relaccedilatildeo agrave boa

Na segunda situaccedilatildeo as variaacuteveis explanatoacuterias com mais de duas categorias foram tratadas como

qualitativas A Tabela 49 apresenta os valores das estatiacutesticas os graus de liberdade e os valores-p

do teste de Lipsitz da versatildeo ordinal do teste de Hosmer-Lemeshow e dos testes qui-quadrado

e razatildeo de verossimilhanccedilas de Pulkstenis-Robinson para verificar a qualidade do ajuste para o

modelo completo contendo todas as variaacuteveis explanatoacuterias Os resultados dessa tabela evidenciam

o bom ajuste do modelo completo exceto para o teste qui-quadrado de Pulkstenis-Robinson

Teste Valor da estatiacutestica Graus de liberdade valor-pLipsitz 4 96 5 0 421

Hosmer-Lemeshow 4 98 9 0 836

Tabela 49 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

Para avaliar a validade da suposiccedilatildeo de chances proporcionais no modelo completo aplicou-se o

teste de proporcionalidade O teste mostrou que o Modelo logito categorias adjacentes com chances

proporcionais parece adequado (valor-p = 0 197)

Novamente ao excluir-se a variaacutevel prova de Unterberg com olhos abertos o modelo logito

categorias adjacentes com chances proporcionais mostrou-se bem ajustado nos quatro testes

Para a seleccedilatildeo das variaacuteveis explanatoacuterias utilizou-se o meacutetodo backward As variaacuteveis que

obtiveram efeito significativo foram depressatildeo (X1) e quando a famiacutelia comeccedilou a perceber a falta

de audiccedilatildeo (X2)

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 51: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

42 ANAacuteLISE INFERENCIAL 37

A Tabela 410 mostra as estimativas dos paracircmetros respectivos erros padrotildees e valores-p para

o modelo final ajustado

Variaacutevel Paracircmetros Estimativa Erro Padratildeo valor-pIntercepto 1 α1 minus2 3920 0 9566 0 012Intercepto 2 α2 0 3290 0 8874 0 711Depressatildeo β1 0 5796 0 3179 0 068

Famiacutelia (1 ano) β2 2 2474 1 0166 0 027Famiacutelia (2 anos) β3 1 3361 0 9515 0 160

Famiacutelia (gt 2 anos) β4 1 8146 0 9201 0 049

Tabela 410 Estimativas dos paracircmetros do modelo selecionado

O modelo final ajustado pode ser expresso em termos dos logitos por

log

[πj(x)

πj+1(x)

]= αj + 0 5796X1 + 2 2472X2 + 1 3361X3 + 1 8146X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos e X4 = 0 caso

contraacuterio

Assim como no modelo anterior utilizou-se a estatiacutestica de Pearson (X2) e razatildeo de verossimi-

lhanccedilas (G2) para verificar a qualidade do ajuste do modelo final O resultado do ajuste pode ser

visto Tabela 411 indicando evidecircncias a favor do modelo

Teste Valor da estatiacutestica Graus de liberdade valor pPearson (X2) 9 10 10 0 523

Razatildeo de verossimilhanccedilas (G2) 8 59 10 0 571

Tabela 411 Testes de qualidade do ajuste - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2 - modelo final

A Figura 42 mostra o graacutefico dos resiacuteduos de Pearson em funccedilatildeo das combinaccedilotildees das categorias

da variaacutevel depressatildeo e da variaacutevel quando a famiacutelia comeccedilou a perceber a falta de audiccedilatildeo com as

categorias da variaacutevel resposta Como os valores situam-se em torno de zero haacute evidecircncias a favor

do modelo

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de um

idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β1) = 1 79

vezes a chance do idoso sem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 52: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

38 APLICACcedilOtildeES 42

Figura 42 Resiacuteduos do Modelo logito categorias adjacentes - Em geral vocecirc diria que sua audiccedilatildeo eacute - situaccedilatildeo 2

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β2) = 9 46 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular eacute exp (β4) = 6 14

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave regular

Devido agrave suposiccedilatildeo de chances proporcionais assumida para o modelo ajustado aos dados as

mesmas conclusotildees satildeo obtidas quanto da chance de um idoso dizer que a sua audiccedilatildeo eacute regular em

relaccedilatildeo agrave boa

Tambeacutem eacute possiacutevel verificar a chance do idoso dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Neste caso o modelo fica expresso por

log

[P (Yi = j|xi)P (Yi = 3|xi)

]=

2sumj=1

αj + 0 5796(3minus j)X1 + 2 2472(3minus j)X2 + 1 3361(3minus j)X3

+ 1 8146(3minus j)X4 j = 1 2

em que X1 = 0 se o indiviacuteduo natildeo tem depressatildeo e X1 = 1 se o indiviacuteduo tem depressatildeo X2 = 1

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 53: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

42 ANAacuteLISE INFERENCIAL 39

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 1 ano e X2 = 0 caso contraacuterio X3 = 1

se a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo em 2 anos e X3 = 0 caso contraacuterio e

X4 = 1 se a famiacutelia comeccedilou perceber o problema de audiccedilatildeo depois de 2 anos X4 = 0 caso

contraacuterio

Quanto agrave interpretaccedilatildeo tem-se que

bull fixada a variaacutevel quando a famiacutelia comeccedilou a perceber o problema de audiccedilatildeo a chance de

um idoso com depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β1) = 3 19

vezes a chance de um idoso que natildeo tem depressatildeo dizer que a sua audiccedilatildeo eacute ruim em relaccedilatildeo

agrave boa

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia comeccedilou a perceber o problema

de audiccedilatildeo em 1 ano dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β2) = 89 55 vezes

a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses dizer

que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

bull fixada a variaacutevel depressatildeo natildeo haacute evidecircncias de que a chance de um idoso dizer que a

audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa seja diferente de quando a famiacutelia comeccedilou a perceber o

problema de audiccedilatildeo em 6 meses ou em 2 anos

bull fixada a variaacutevel depressatildeo a chance de um idoso cuja famiacutelia demorou mais de 2 anos para

perceber a falta de audiccedilatildeo dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa eacute exp (2β4) = 37 68

vezes a chance de um idoso cuja famiacutelia comeccedilou a perceber a falta de audiccedilatildeo em 6 meses

dizer que a audiccedilatildeo eacute ruim em relaccedilatildeo agrave boa

Utilizou-se o Criteacuterio de Informaccedilatildeo Akaike (AIC) para comparar o modelo considerando as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas com o modelo que considera

as variaacuteveis explanatoacuterias como qualitativas A partir da Tabela 412 e da mesma forma que nos

modelos anteriores nota-se que o menor AIC foi para o modelo mais simples o qual considera as

variaacuteveis explanatoacuterias com mais de duas categorias como quantitativas Entretanto o modelo o

qual considera as variaacuteveis com mais de duas categorias como quantitativas apresentou apenas uma

variaacutevel significativa Jaacute o modelo que considera as variaacuteveis com mais de duas categorias como

qualitativas apresentou duas variaacuteveis explanatoacuterias significativas

Por uacuteltimo ajustou-se o Modelo logito cumulativo com chances proporcionais para as mesmas

variaacuteveis explanatoacuterias e resposta e obteve-se as mesmas variaacuteveis explanatoacuterias significativas tanto

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 54: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

40 APLICACcedilOtildeES 42

Modelo AICModelo (qualitativa) 25304

Modelo (quantitativa) 25075

Tabela 412 AIC dos modelos ajustados - Em geral vocecirc diria que a sua audiccedilatildeo eacute

para o modelo que considera as variaacuteveis explanatoacuterias com mais de duas categorias como quantita-

tiva quanto para o modelo que considera como qualitativa Aleacutem disso os efeitos concordaram em

ambos modelos

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 55: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

Capiacutetulo 5

Conclusotildees e sugestotildees para pesquisas futuras

O objetivo central deste trabalho foi apresentar uma revisatildeo das teacutecnicas de diagnoacutestico dos

principais modelos ordinais com ecircnfase nos Modelos logito cumulativo Modelos logito categorias

adjacentes e Modelos logito razatildeo contiacutenua uacuteteis para descrever a relaccedilatildeo entre a variaacutevel resposta

ordinal e uma ou mais variaacuteveis explanatoacuterias

Existem algumas opccedilotildees para verificar a qualidade do ajuste para estes modelos quando as

variaacuteveis explanatoacuterias satildeo categoacutericas e natildeo haacute valores esparsos tais como teste de Pearson teste

da razatildeo de verossimilhanccedilas e os resiacuteduos de Pearson Quando variaacuteveis preditoras contiacutenuas estatildeo

presentes no modelo ou quando os valores satildeo esparsos a estatiacutestica X2 de Pearson e a estatiacutestica

G2 da razatildeo de verossimilhanccedilas natildeo satildeo adequadas para verificar a qualidade do ajuste Para

esses casos utiliza-se o teste de Lipsitz os testes qui-quadrado e razatildeo de verossimilhanccedilas de

Pulkstenis-Robinson e a versatildeo ordinal do teste de Hosmer-Lemeshow

Atualmentes os Modelos logito cumulativo Modelos logito categorias adjacentes e Modelos

logito razatildeo contiacutenua podem ser ajustados visto que estes se encontram implementados nos

principais pacotes computacionais Entretanto o teste de Lipsitz os testes qui-quadrado e razatildeo

de verossimilhanccedilas de Pulkstenis-Robinson e a versatildeo ordinal do teste Hosmer-Lemeshow no

software R estatildeo disponiacuteveis apenas para o Modelo logito cumulativo com chances proporcionais

(pacote generalhoslem) Em virtude destes testes natildeo estarem implementados para o Modelo

logito categorias adjacentes com chances proporcionais estes foram desenvolvidos nessa dissertaccedilatildeo

Recentemente Fagerland e Hosmer (2017) apresentaram o comando ologitgof implementado no

Stata o qual calcula os testes mencionados para avaliar a adequaccedilatildeo dos modelos supracitados

Para a aplicaccedilatildeo apresentada neste trabalho selecionaram-se o Modelo logito cumulativo com

chances proporcionais e o Modelo logito categorias adjacentes com chances proporcionais para

investigar a relaccedilatildeo entre a perda auditiva o equiliacutebrio e os aspectos emocionais no idoso Os

modelos com chances proporcionais apresentaram melhor ajuste do que os modelos sem chances

proporcionais

41

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 56: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

42 CONCLUSOtildeES E SUGESTOtildeES PARA PESQUISAS FUTURAS

Quando ajustados os Modelos logito cumulativo e categorias adjacentes ambos com chances

proporcionais e com as mesmas variaacuteveis explanatoacuterias e resposta foram selecionadas as mesmas

variaacuteveis explanatoacuterias nos dois modelos

Ainda haacute muito o que ser desenvolvido em pesquisas futuras para as teacutecnicas de diagnoacutesticos

dos modelos ordinais tanto na parte teoacuterica quanto em desenvolvimento de software Por exemplo

ainda natildeo haacute meacutetodos disponiacuteveis para acessar a qualidade do ajuste para os modelos sem chances

proporcionais ou com chances proporcionais parciais e que consideram variaacuteveis explanatoacuterias

contiacutenuas Uma opccedilatildeo seria categorizar a variaacutevel explanatoacuteria contiacutenua ou utilizar o modelo de

regressatildeo logiacutestica multinomial os quais dispotildeem de teacutecnicas de diagnoacutesticos Entretanto muita

informaccedilatildeo pode ser perdida com a categorizaccedilatildeo da variaacutevel ou com a utilizaccedilatildeo do modelo de

regressatildeo logiacutestica multinomial visto que este modelo ignora a ordem das categorias da variaacutevel

resposta

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 57: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

Apecircndice A

Anaacutelise descritiva

Prova Time Up and GoSexo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Masculino 23 (26) 61 (68) 5 (6) 89 (100)Feminino 7 (14) 36 (74) 6 (12) 49 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A1 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Sexo

Prova Time Up and GoEscolaridade ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos TotalAnalfabeto 3 (25) 7 (58) 2 (17) 12 (100)

Ensino Fundamental 14 (15) 72 (76) 9 (9) 95 (100)Ensino Meacutedio 9 (33) 18 (67) 0 (0) 27 (100)

Graduaccedilatildeo 4 (100) 0 (0) 0 (0) 4 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A2 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Escolaridade

Prova Time Up and GoRenda Mensal ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

lt 1 SM 0 (0) 10 (100) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 16 (18) 65 (71) 10 (11) 91 (100)gt 1 SM a 2 SM 6 (25) 17 (71) 1 (4) 24 (100)

gt 2 SM 8 (62) 5 (38) 0 (0) 13 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A3 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Renda mensal

Prova Time Up and GoDepressatildeo ateacute 10 segundos entre 11 e 20 segundos gt 20 segundos Total

Natildeo 11 (22) 38 (78) 0 (0) 49 (100)Sim 19 (21) 59 (66) 11 (13) 89 (100)

Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A4 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Depressatildeo

43

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 58: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

44 APEcircNDICE A

Figura A1 Box plot da variaacutevel Idade por categoria da variaacutevel Prova Time Up and Go

Prova Time Up and GoQuando a famiacutelia comeccedilou a perceber ateacute 10s entre 11 e 20s gt 20s Total

6 meses 2 (50) 2 (50) 0 (0) 4 (100)1 ano 4 (23) 11 (65) 2 (12) 17 (100)2 anos 2 (8) 23 (88) 1 (4) 26 (100)

mais de 2 anos 22 (24) 61 (67) 8 (9) 91 (100)Total 30 (22) 97 (70) 11 (8) 138 (100)

Tabela A5 Distribuiccedilatildeo conjunta das variaacuteveis Prova Time Up and Go e Quando a famiacutelia comeccedilou a perceber

Em geral vocecirc diria que sua audiccedilatildeo eacuteSexo Ruim Regular Boa Total

Masculino 37 (41) 46 (52) 6 (7) 89 (100)Feminino 20 (41) 27 (55) 2 (4) 49 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A6 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Sexo

Em geral vocecirc diria que sua audiccedilatildeo eacuteEscolaridade Ruim Regular Boa TotalAnalfabeto 6 (50) 6 (50) 0 (0) 12 (100)

Ensino Fundamental 40 (42) 49 (52) 6 (6) 95 (100)Ensino Meacutedio 9 (33) 16 (59) 2 (8) 27 (100)

Graduaccedilatildeo 2 (50) 2 (50) 0 (0) 4 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A7 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Escolaridade

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 59: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

ANAacuteLISE DESCRITIVA 45

Em geral vocecirc diria que sua audiccedilatildeo eacuteRenda Mensal Ruim Regular Boa Total

Sem Renda 6(60) 4 (40) 0 (0) 10 (100)1 Salaacuterio Miacutenimo 35 (39) 53 (58) 3 (3) 91 (100)gt 1 SM a 2 SM 10 (42) 11 (46) 3 (12) 24 (100)

gt 2 SM 6 (46) 5 (39) 2 (15) 13 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A8 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Renda mensal

Figura A2 Box plot da variaacutevel Idade por categoria da variaacutevel Em geral vocecirc diria que sua audiccedilatildeo eacute

Em geral vocecirc diria que sua audiccedilatildeo eacuteDepressatildeo Ruim Regular Boa Total

Natildeo 14 (29) 32 (65) 3 (6) 49 (100)Sim 43 (48) 41 (46) 5 (6) 89 (100)

Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A9 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Depressatildeo

Em geral vocecirc diria que sua audiccedilatildeo eacuteQuando a famiacutelia comeccedilou a perceber Ruim Regular Boa Total

6 meses 0 (0) 3 (75) 1 (25) 4 (100)1 ano 10 (59) 6 (35) 1 (6) 17 (100)2 anos 9 (35) 14 (54) 3 (11) 26 (100)

mais de 2 anos 38 (42) 50 (55) 3 (3) 91 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A10 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Quando a famiacuteliacomeccedilou a perceber

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 60: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

46 APEcircNDICE A

Em geral vocecirc diria que sua audiccedilatildeo eacuteProva de Unterbeg com olhos abertos Ruim Regular Boa Total

Negativo 51 (40) 71 (55) 7 (5) 129 (100)Positivo 6 (67) 2 (22) 1 (11) 9 (100)Total 57 (41) 73 (53) 8 (6) 138 (100)

Tabela A11 Distribuiccedilatildeo conjunta das variaacuteveis Em geral vocecirc diria que a sua audiccedilatildeo eacute e Prova de Unterbergcom olhos abertos

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 61: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

Apecircndice B

Coacutedigos usados no software R

Neste apecircndice satildeo apresentados os coacutedigos em R utilizados na aplicaccedilatildeo

1 Coacutedigo usado para o ajuste do Modelo logito cumulativo com chances proporcionais

require(MASS)

mlc lt- polr(PROVA~DEPRESSAO+FAMILIA+IDADE+SEXO+ESCOLARIDADE

+RENDAMENSAL dados2)

2 Coacutedigos usados para verificar a qualidade do ajuste do Modelo logito cumulativo com chances

proporcionais

require(generalhoslem)

lipsitztest(mlc g=6)

logitgof(dados2$PROVA fitted(mlc) g=6 ord = TRUE)

pulkrobchisq(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

pulkrobdeviance(mlc c(DEPRESSAOFAMILIASEXO

ESCOLARIDADERENDAMENSAL))

3 Coacutedigo usado para testar a suposiccedilatildeo de chances proporcionais

require(VGAM)

mlc2lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=TRUEreverse=FALSE) dados2)

mlc3lt-vglm(PROVA~IDADE+RENDAMENSAL

cumulative(parallel=FALSEreverse=FALSE) dados2)

lrtest(mlc2mlc3)

4 Coacutedigo usado para o ajuste do Modelo logito categorias adjacentes com chances proporcionais

require(VGAM)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

47

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 62: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

48 APEcircNDICE B

5 Coacutedigo usado para o teste de Lipsitz do Modelo logito categorias adjacentes com chances

proporcionais

fitted(catadj)

est lt- fitted(catadj)c(123)

matrix lt- cbind(estdados2$ID)

Grupo1 lt-c(rep(123)rep(0115))

Grupo2 lt-c(rep(023)rep(123)rep(092))

Grupo3 lt-c(rep(046)rep(123)rep(069))

Grupo4 lt-c(rep(069)rep(123)rep(046))

Grupo5 lt-c(rep(092)rep(123)rep(023))

Grupo6 lt-c(rep(0115)rep(123))

teste lt-dataframe(est dados2$ID)

teste1 lt-teste[order(teste$est)]

teste2 lt-dataframe(teste1Grupo1Grupo2Grupo3Grupo4Grupo5Grupo6)

teste3 lt-teste2[order(teste2$dados2ID)]

ESTlt-fitted(catadj)

colnames(EST)lt-c(EST1EST2EST3)

teste4 lt- dataframe(teste3 OPINIAO=dados2$OPINIAOEST)

catadjlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSALacat(parallel=TRUEreverse=TRUE) dados2)

catadjLPlt-vglm(OPINIAO~DEPRESSAO+UNTERBERG+FAMILIA+IDADE+SEXO+

ESCOLARIDADE+RENDAMENSAL+teste3$Grupo1+teste3$Grupo2+teste3$Grupo3

+teste3$Grupo4+teste3$Grupo5acat(parallel=TRUEreverse=TRUE) dados2)

lrtest(catadjLPcatadj)

6 Coacutedigo usado para a versatildeo ordinal do teste de Hosmer-Lemeshow do Modelo logito categorias

adjacentes com chances proporcionais

N1lt-subset(teste4OPINIAO==1)

NN1lt-c(dim(subset(N1Grupo1==1))[1]

dim(subset(N1Grupo2==1))[1]

dim(subset(N1Grupo3==1))[1]

dim(subset(N1Grupo4==1))[1]

dim(subset(N1Grupo5==1))[1]

dim(subset(N1Grupo6==1))[1])

N2lt-subset(teste4OPINIAO==2)

NN2lt-c(dim(subset(N2Grupo1==1))[1]

dim(subset(N2Grupo2==1))[1]

dim(subset(N2Grupo3==1))[1]

dim(subset(N2Grupo4==1))[1]

dim(subset(N2Grupo5==1))[1]

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 63: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

COacuteDIGOS USADOS NO SOFTWARE R 49

dim(subset(N2Grupo6==1))[1])

N3lt-subset(teste4OPINIAO==3)

NN3lt-c(dim(subset(N3Grupo1==1))[1]

dim(subset(N3Grupo2==1))[1]

dim(subset(N3Grupo3==1))[1]

dim(subset(N3Grupo4==1))[1]

dim(subset(N3Grupo5==1))[1]

dim(subset(N3Grupo6==1))[1])

OOlt-cbind(NN1NN2NN3)

EE1lt-c(sum(subset(teste4Grupo1==1)$EST1)

sum(subset(teste4Grupo2==1)$EST1)

sum(subset(teste4Grupo3==1)$EST1)

sum(subset(teste4Grupo4==1)$EST1)

sum(subset(teste4Grupo5==1)$EST1)

sum(subset(teste4Grupo6==1)$EST1))

EE2lt-c(sum(subset(teste4Grupo1==1)$EST2)

sum(subset(teste4Grupo2==1)$EST2)

sum(subset(teste4Grupo3==1)$EST2)

sum(subset(teste4Grupo4==1)$EST2)

sum(subset(teste4Grupo5==1)$EST2)

sum(subset(teste4Grupo6==1)$EST2))

EE3lt-c(sum(subset(teste4Grupo1==1)$EST3)

sum(subset(teste4Grupo2==1)$EST3)

sum(subset(teste4Grupo3==1)$EST3)

sum(subset(teste4Grupo4==1)$EST3)

sum(subset(teste4Grupo5==1)$EST3)

sum(subset(teste4Grupo6==1)$EST3))

EElt-cbind(EE1EE2EE3)

sum(((OO-EE)^2)EE)

1-pchisq(sum(((OO-EE)^2)EE)9)

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 64: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

50 APEcircNDICE B

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 65: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

Referecircncias Bibliograacuteficas

Agresti(2003) Alan Agresti Categorical data analysis John Wiley amp Sons Citado na paacuteg 8

Agresti(2010) Alan Agresti Analysis of ordinal categorical data John Wiley amp Sons Citado na paacuteg 28 9 11 13 14 19 26 27

Agresti(1984) Alan Agresti Analysis of Categorical Data Wiley New York Citado na paacuteg 2

Agresti(1996) Alan Agresti An introduction to categorical data analysis Wiley New York Citado na

paacuteg 8 19

Akaike(1974) Hirotugu Akaike A new look at the statistical model identification IEEE transactionson automatic control 19716ndash723 Citado na paacuteg 27

Brant(1990) Rollin Brant Assessing proportionality in the proportional odds model for ordinallogistic regression Biometrics 461171ndash1178 Citado na paacuteg 26

Corporation(2017) IBM Corporation IBM SPSS Statistic 25 Core System Useracutes Guide 2017 URLhttpswww-01ibmcomsupportdocviewwssuid=swg24043678 Citado na paacuteg 10

Cullagh(1980) MC Cullagh Regression models for ordinal data (with discussion) J Roy StatistSoc B 42109ndash142 Citado na paacuteg 2 9 10

Fagerland e Hosmer(2016) Morten W Fagerland e David W Hosmer Tests for goodness of fitin ordinal logistic regression models Journal of Statistical Computation and Simulation 863398ndash3418 Citado na paacuteg 2 24 25

Fagerland e Hosmer(2017) Morten W Fagerland e David W Hosmer How to test for goodness offit in ordinal logistic regression models The Stata Journal 17668ndash686 Citado na paacuteg 41

Fagerland e Hosmer(2013) Morten W Fagerland e David W Hosmer A goodness-of-fit test for theproportional odds regression model Statistics in medicine 322235ndash2249 Citado na paacuteg 2 23 2425

Feinberg(1980) Stephen E Feinberg The analysis of cross-classified categorical data MassachusettsInstitute of Technology Press Cambridge and London Citado na paacuteg 2

Freeman Jr(1987) Daniel H Freeman Jr Applied categorical data analysis Marcel Dekker Inc Citado

na paacuteg 19 21

Giolo(2017) Suely Ruiz Giolo Introduccedilatildeo agrave anaacutelise de dados categoacutericos com aplicaccedilotildees EdgardBlucher Citado na paacuteg 19

Hosmer e Lemeshow(1980) David W Hosmer e Stanley Lemeshow Goodness of fit tests for themultiple logistic regression model Communications in statistics-Theory and Methods 91043ndash1069Citado na paacuteg 20 21

Kim(2003) Ji-Hyun Kim Assessing practical significance of the proportional odds assumptionStatistics amp probability letters 65233ndash239 Citado na paacuteg 26

51

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas
Page 66: Marina Calais de Freitas Moura D Programa: Estatística ... · métodos desenvolvidos para análise de variáveis ordinais. Assim, estes métodos, só podem ser utilizados para variáveis

52 REFEREcircNCIAS BIBLIOGRAacuteFICAS

Lipsitz et al(1996) Stuart R Lipsitz Garrett M Fitzmaurice e Geert Molenberghs Goodness-of-fittests for ordinal response regression models Journal of the Royal Statistical Society Series C(Applied Statistics) 45175ndash190 Citado na paacuteg 2 20 21

Magrini(2015) A M Magrini Investigar a relaccedilatildeo entre a perda auditiva os aspectos emocionais e oequiliacutebrio no idoso Tese de doutorado Pontifiacuteca Universidade Catoacutelica de Satildeo Paulo Citado na paacuteg

29

Nelder e Wedderburn(1972) J A Nelder e W Wedderburn Generalized linear models Journal ofthe Royal Statistical Society Series A 135370ndash384 Citado na paacuteg 2 5

Paulino e Singer(2006) Carlos Daniel Mimoso Paulino e Julio da Motta Singer Anaacutelise de dadoscategorizados Edgard Bluumlcher Citado na paacuteg 1

Peterson e Harrell Jr(1990) Bercedis Peterson e Frank E Harrell Jr Partial proportional oddsmodels for ordinal response variables Applied statistics 39205ndash217 Citado na paacuteg 10 26

Pulkstenis e Robinson(2004) Erik Pulkstenis e Timothy J Robinson Goodness-of-fit tests forordinal response regression models Statistics in medicine 23999ndash1014 Citado na paacuteg 2 22

R Core Team(2017) R Core Team R A Language and Environment for Statistical Computing RFoundation for Statistical Computing Vienna Austria 2017 URL httpwwwR-projectorgCitado na paacuteg 10

SAS(2013) SAS Base SAS 94 procedures guide Statistical procedures 2013 URL httpssupportsascomdocumentationcdlenprocstat66703HTMLdefaultviewerhtmtitlepagehtm Citado

na paacuteg 10

Stata et al(2017) A Stata et al Stata base reference manual release 15 Stata Press Texas 2017URL httpswwwstatacombookstorebase-reference-manual Citado na paacuteg 22

Tutz(1991) Gerhard Tutz Sequential models in categorical regression Computational Statistics ampData Analysis 11275ndash295 Citado na paacuteg 14

Walker e Duncan(1967) Strother H Walker e David B Duncan Estimation of the probability of anevent as a function of several independent variables Biometrika 54167ndash179 Citado na paacuteg 2 10

  • Lista de Abreviaturas
  • Lista de Figuras
  • Lista de Tabelas
  • Introduccedilatildeo
    • Objetivos
    • Organizaccedilatildeo do texto
      • Modelos de Regressatildeo Logiacutestica Ordinal
        • Modelos lineares generalizados
        • Modelo de regressatildeo logiacutestica
        • Principais modelos ordinais
          • Modelo logito cumulativo
          • Modelo logito categorias adjacentes
          • Modelo logito razatildeo contiacutenua
              • Teacutecnicas de Diagnoacutestico
                • Conceitos baacutesicos
                • Testes da qualidade do ajuste do modelo
                  • Teste de Pearson e teste da razatildeo de verossimilhanccedilas
                  • Teste de Lipsitz
                  • Teste de Pulkstenis-Robinson
                  • Versatildeo ordinal do teste de Hosmer-Lemeshow
                  • Comparaccedilatildeo entre os testes
                    • Teste de proporcionalidade
                    • Anaacutelise de resiacuteduos
                    • Criteacuterio de informaccedilatildeo Akaike
                    • Meacutetodo de seleccedilatildeo
                      • Aplicaccedilotildees
                        • Dados utilizados
                        • Anaacutelise inferencial
                          • Prova Time Up and Go
                          • Em geral vocecirc diria que sua audiccedilatildeo eacute
                              • Conclusotildees e sugestotildees para pesquisas futuras
                              • Anaacutelise descritiva
                              • Coacutedigos usados no software R
                              • Referecircncias Bibliograacuteficas