TÉCNICAS DE ANÁLISE MULTIVARIADA PARA AVALIAÇÃO … ... habilidade matemática, memo- ... dos...

15
TÉCNICAS DE ANÁLISE MULTIVARIADA PARA AVALIAÇÃO DAS CONDIÇÕES DE SAÚDE DOS MUNICÍPIOS DO RIO GRANDE DO SUL, BRASIL Silvio Possoli* POSSOLI, S. Técnicas de análise multivariada para avaliação das condições de saúde dos muni- cípios do Rio Grande do Sul, Brasil. Rev. Saúde públ., S. Paulo, 18: 288 - 300, 1984. RESUMO: Estudou-se a estrutura de correlação de variáveis da área de Saúde Pública para a obtenção de um "Índice do Nível de Saúde" para os municípios do Rio Grande do Sul. Uti- lizando o valor deste índice para cada município formamos 18 grupos homogêneos ("clusters") ordenados de forma decrescente de carência quanto ao nível de saúde. Outros índices foram encontrados: "Índice de Imunização" e "Índice de Não-Assistência Médico-Hospitalar". A variá- vel mortalidade proporcional para menores de 5 anos, do conjunto total das variáveis trabalha- das, foi a que apresentou maior poder discriminativo e de diagnóstico; o peso ao nascer com menos de 2.700g, foi de menor poder diagnóstico. UNITERMOS: Índice do Nível de Saúde. Municípios do Rio Grande do Sul, condições de saúde. Análise multivariada. INTRODUÇÃO Em diversas áreas como: Psicologia, So- ciologia, Biologia, Medicina, Educação e Economia, deparamo-nos com observações de várias variáveis para cada elemento de uma amostra (ou população) de indivíduos. É de interesse examinar as inter-relações entre as variáveis. Estas inter-relações podem ser avaliadas ou pelas covariâncias ou pelos coeficientes de correlação entre as variáveis. Se o número de variáveis é grande deseja-se estruturar e simplificar os dados de manei- ra a conservar o máximo de informação expressa pelas variáveis originais. Uma solu- ção para este problema é encontrar variáveis hipotéticas que sejam combinações lineares das variáveis observadas e assim mais conve- nientemente estudadas por seu menor nú- mero. Em muitos problemas, após o encontro destas variáveis hipotéticas, que resumiriam as informações das variáveis originais, deseja- se unir os indivíduos formando grupos ho- mogêneos. O ramo da Estatística que trata da análise de dados em várias dimensões, de vários indivíduos é a Análise Multivariada. O presente trabalho tem por objetivos: - a obtenção de um Índice do Nível de Saú- de, considerando variáveis da área de Saú- de Pública, para os municípios do Estado do Rio Grande do Sul, utilizando técnicas estatísticas de Análise Multivariada; - a hierarquização dos municípios através da formação de grupos homogêneos se- gundo o Índice do Nível de Saúde. METODOLOGIA Duas técnicas são aqui utilizadas para tra- tar do problema: Análise Fatorial 4 e Análise de Agrupamento ("Cluster Analysis") 3 . * Da Secretaria da Saúde e do Meio Ambiente do Rio Grande do Sul e do Departamento de Estatís- tica da Universidade Federal do Rio Grande do Sul e da Pontifícia Universidade Católica do Rio Grande do Sul - Av. Borges de Medeiros, 1501 - 5 o andar - 90000 - Porto Alegre, RS.

Transcript of TÉCNICAS DE ANÁLISE MULTIVARIADA PARA AVALIAÇÃO … ... habilidade matemática, memo- ... dos...

TÉCNICAS DE ANÁLISE MULTIVARIADA PARA AVALIAÇÃO DASCONDIÇÕES DE SAÚDE DOS MUNICÍPIOS

DO RIO GRANDE DO SUL, BRASIL

Silvio Possoli*

POSSOLI, S. Técnicas de análise multivariada para avaliação das condições de saúde dos muni-cípios do Rio Grande do Sul, Brasil. Rev. Saúde públ., S. Paulo, 18: 288 - 300, 1984.

RESUMO: Estudou-se a estrutura de correlação de variáveis da área de Saúde Pública paraa obtenção de um "Índice do Nível de Saúde" para os municípios do Rio Grande do Sul. Uti-lizando o valor deste índice para cada município formamos 18 grupos homogêneos ("clusters")ordenados de forma decrescente de carência quanto ao nível de saúde. Outros índices foramencontrados: "Índice de Imunização" e "Índice de Não-Assistência Médico-Hospitalar". A variá-vel mortalidade proporcional para menores de 5 anos, do conjunto total das variáveis trabalha-das, foi a que apresentou maior poder discriminativo e de diagnóstico; o peso ao nascer commenos de 2.700g, foi de menor poder diagnóstico.

UNITERMOS: Índice do Nível de Saúde. Municípios do Rio Grande do Sul, condições desaúde. Análise multivariada.

INTRODUÇÃO

Em diversas áreas como: Psicologia, So-ciologia, Biologia, Medicina, Educação eEconomia, deparamo-nos com observaçõesde várias variáveis para cada elemento deuma amostra (ou população) de indivíduos.

É de interesse examinar as inter-relaçõesentre as variáveis. Estas inter-relações podemser avaliadas ou pelas covariâncias ou peloscoeficientes de correlação entre as variáveis.Se o número de variáveis é grande deseja-seestruturar e simplificar os dados de manei-ra a conservar o máximo de informaçãoexpressa pelas variáveis originais. Uma solu-ção para este problema é encontrar variáveishipotéticas que sejam combinações linearesdas variáveis observadas e assim mais conve-nientemente estudadas por seu menor nú-mero.

Em muitos problemas, após o encontrodestas variáveis hipotéticas, que resumiriamas informações das variáveis originais, deseja-

se unir os indivíduos formando grupos ho-mogêneos.

O ramo da Estatística que trata da análisede dados em várias dimensões, de váriosindivíduos é a Análise Multivariada.

O presente trabalho tem por objetivos:- a obtenção de um Índice do Nível de Saú-

de, considerando variáveis da área de Saú-de Pública, para os municípios do Estadodo Rio Grande do Sul, utilizando técnicasestatísticas de Análise Multivariada;

- a hierarquização dos municípios atravésda formação de grupos homogêneos se-gundo o Índice do Nível de Saúde.

METODOLOGIA

Duas técnicas são aqui utilizadas para tra-tar do problema: Análise Fatorial4 e Análisede Agrupamento ("Cluster Analysis")3.

* Da Secretaria da Saúde e do Meio Ambiente do Rio Grande do Sul e do Departamento de Estatís-tica da Universidade Federal do Rio Grande do Sul e da Pontifícia Universidade Católica do RioGrande do Sul - Av. Borges de Medeiros, 1501 - 5o andar - 90000 - Porto Alegre, RS.

Análise FatorialNesta técnica o que se faz é substituir um

conjunto inicial (não ordenado) de p-va-riáveis, X1, X2, . . ., Xp, correlacionadas,por um conjunto menor de fatores comuns(ou variáveis hipotéticas) que podem não sercorrelacionados (fatores ortogonais) ou cor-relacionados (fatores oblíquos). Deseja-sedeterminar um número mínimo de fatoresnecessários para explicar a maior parte da va-riância do conjunto original de variáveis. AAnálise Fatorial é baseada em um modeloestatístico tratando da explicação da estrutu-ra de covariância das variáveis originais. Algu-ma variância que não é explicada pelos fato-res comuns pode ser descrita pelo termode 'erro' residual (ou fatores específicos)4,8.

As idéias básicas de Análise Fatorial sur-giram por volta de 1900 por Francis Galtone Charles Spearman entre outros, e origina-da principalmente a partir dos esforços dospsicólogos em obter uma melhor compreen-são da 'inteligência'. Os testes de inteligên-cia contêm uma variedade de questões quedependem de uma maior ou menor habili-dade verbal, habilidade matemática, memo-rização, etc. . . .Esta técnica foi desenvolvi-da para analisar estes testes assim como paradeterminar se a 'inteligência' é medida porum único fator principal envolvendo todosos testes ou por diversos fatores, mais limi-tados, medindo atributos como 'habilidadematemática'. Charles Spearman em seu arti-go publicado em 1904 intitulado "GeneralIntelligence Objectively Determined andMeasured" apresenta sua teoria sobre um fa-tor de inteligência geral, seu famoso fator"g"2

O modelo de Análise Fatorial assume quecada variável observada é representada comouma função linear de um menor no de fato-res comuns (por serem comuns as várias va-riáveis) mais uma componente de variaçãoresidual (fatores específicos). Assim,

onde:o peso []ij é a carga fatorial da i-ési-ma variável no j-ésimo fator comume refletem a importância do j-ésimofator na composição da i-ésima va-riável.

fj: são chamados fatores comuns.

ei são os fatores específicos, descrevem avariação residual específica da i-ésimavariável, resíduo que afeta somente Xi.

A expressão (1) é usualmente escrita nanotação matricial:

onde:

X é o vetor das variáveis observadas (Xi)

f é o vetor dos fatores comuns (fi)

e é o vetor dos fatores específicos (ei)

A matriz de cargas fatoriais

A matriz de variâncias e covariân-cias das variáveis observadas, [], pode ser es-crita como,

supondo fatores não correlacionados de va-riância unitária, supondo os p-fatores especí-ficos não correlacionados entre si e em rela-ção aos fatores comuns, e que a variância deei é igual a []i (variância residual ou especifi-cidade). Temos então que [] é matriz diagonalpxp cujos elementos da diagonal são as espe-cificidades de cada variável Xi.

As expressões (2) e (3) são chamadas deModelo de Análise Fatorial9.

No presente trabalho esta técnica é utili-zada para a obtenção de índices, relaciona-dos às condições de saúde, que podem pre-

servar de forma relevante a totalidade dasinformações obtidas por meio das variáveisoriginais, para os 232 municípios do Estadodo Rio Grande do Sul. Os primeiros fatoresserão, então, os índices buscados.

A opção selecionada para a obtenção dosfatores foi o Método do Fator Principal semInteração (PAI). Este método originou-se notrabalho de Hotelling7 (1933) e é extrema-mente relacionado com a Análise de Com-ponentes Principais.

De possse dos índices poder-se-á obter osescores fatoriais (estimativa dos valores dosíndices para cada unidade e são funções dasvariáveis observadas) para cada município.

Análise de Agrupamento ("Cluster Ana-lysü")3

O objetivo desta técnica multivariada é:dado um número de objetos ou indivíduoscada um descrito, por um conjunto de me-didas, obter um esquema de classificação pa-ra agrupar os indivíduos em um número declasses tal que os indivíduos dentro das clas-ses são similares em algum aspecto e diferen-te dos das outras classes. O número de clas-ses e as características de cada classe devemser determinadas. Em suma, esta técnicaagrupa elementos de modo a formar gruposhomogêneos dentro deles e heterogêneosentre eles.

O critério para formação dos grupos édado por medidas de similaridades, dissimila-ridades ou distâncias que podem ser, porexemplo, distância euclidiana, X2 de associa-ção, D2 de Mahalanobis, distância métrica deMinkowski e medidas de similaridade criadasespecialmente para variáveis em diferentesescalas de medida.

Em geral, os dados brutos a serem subme-tidos à Análise de Agrupamento consistemde uma matriz X, N x p.

As técnicas de Análise de Agrupamentopodem ser usadas como redução de dados,visto que reduzem a informação de um con-junto total de N indivíduos para a informa-ção sobre K- grupos, onde K é muito menorde que N.

Não é conveniente usar número muitogrande de variáveis para esta técnica, por issosugere-se utilizar a técnica de ComponentesPrincipais ou Análise Fatorial para reduzir onúmero de variáveis usando as primeirascomponentes principais ou os primeiros fa-tores. _

Everitt3 (1974) apresenta as principaistécnicas para Análise de Agrupamento. Nes-te trabalho utilizou-se apenas o Método deWard (método aglomerativo da Técnica Hie-rárquica de "Cluster").

Ward13 (1963) propôs que, em qualquerestágio de uma análise, a perda da informa-ção, a qual resulta do agrupamento de indi-víduos em conglomerado ("Cluster"), podeser medida pela soma total dós quadradosdos desvios de cada ponto, da média do con-glomerado ao qual ele pertence. A cada pas-so da análise, a união de cada possível paide grupo é considerada e os dois grupos, «cujaunião resulta no mínimo aumento na somados quadrados dos desvios, são combinados.

A percentagem de perda da informaçãoé dada pela expressão:

SQD é a soma dos quadrados dos desvios.SQD dentro é calculado entre os indivíduosdo grupo que se está considerando e SQDtotal é calculada entre todos os indivíduossubmetidos a Análise de Agrupamento.

Obtidos, então, os índices e os valoresdestes para os municípios (escores fatoriais),pela Análise Fatorial, a técnica de Análise deAgrupamento será aplicada aos vajores decada um dos índices.

Neste trabalho são apresentados os gru-pos homogêneos obtidos com base no índicedo Nível de Saúde.

Escolha das variáveis

A escolha das variáveis selecionadas ba-seou-se em informações extraídas de relató-rios, bem como de opiniões de profissionaisligados à área da Saúde Pública.

As variáveis selecionadas para a elabo-ração do estudo foram:

V01 — Mortalidade Proporcional para Meno-res de 5 anos

V02 - Mortalidade Proporcional para Maio-res de 50 anos (Coeficiente de Swa-roop-Uemura)

V03 — Coeficiente de Mortalidade InfantilTardia

V04 — Coeficiente de Mortalidade InfantilV05 - % Crianças com Peso ao Nascer Me-

nor 2.700 gramasV06 - % partos Não-HospitalaresV07 — Mortalidade Proporcional por Doen-

ças Infecciosas e ParasitáriasV08 - Coeficiente de Mortalidade MaternaV09 - % de óbitos Mal-DefinidosV10- % Menores de um ano vacinados —

Vacina Sabin (3a dose)V11 — % Menores de um ano vacinado —

Vacina Tríplice (3a dose)

V12 - Coeficiente Geral de incidência deSarampo

V 1 3 — Coeficiente de Incidência de Saram-po, Menores de 1 ano

V14— % Menores de um ano vacinados —Vacina contra Sarampo

V15 — Coeficiente Incidência de Tuberculo-se

V16 - Coeficiente Incidência de TétanoNeo-Natal

A variável Expectativa de Vida ao Nascerpela não viabilidade de obtenção foi descon-siderada. Também variáveis como Coeficien-te de Mortalidade Materna e Coeficiente deIncidência de Tétano Neo-Natal, devido aoreduzido número de municípios que apresen-tavam valores não nulos destas variáveis, fo-ram desconsideradas.

Obtenção dos dados

Os dados para o cálculo das variáveis, emcada município do Estado do Rio Grandedo Sul, foram obtidos na Secretaria de Saúdedo Estado para o ano de 1979* (último anoonde havia disponibilidade de utilização dos

dados para a maioria das variáveis).Foram também utilizadas estimativas,

com base no registro de Nascimento * * e noCenso de 19705, para o número de criançasmenores de um ano; e estimativa para a po-pulação total de cada município com basenos dados preliminares do Censo de 19806.

Após a coleta e organização dos dados foiutilizado o subprograma "FACTOR" doSPSS ("Statistical Package for Social Scien-ces")10.

RESULTADOS E ANÁLISE

Matriz de Correlação

Partindo da matriz de dados brutos, comos valores referentes às 14 variáveis, já es-pecificadas, para cada município, obteve-sea matriz de correlação utilizando-se o Coefi-ciente de Correlação de Pearson (Tabela 1).Na análise de matriz de correlação, conside-raram-se como "boa" correlação aquelescoeficientes maiores ou iguais a 0,35 em va-lor absoluto (embora, a um nível [] = 0,01,com 230 graus de liberdade, são estatistica-mente significantes todos os coeficientesmaiores do que | ±0,168 |).

Na Tabela 2 utilizou-se a seguinte conven-ção: Os coeficientes de correlação maioresou iguais ± 0,35 aparecerão na matriz casocontrário aparecerá "0".

A distribuição dos bons coeficientes ilus-tra quão mais indicadoras ou diagnósticassão certas variáveis em relação às outras den-tro de universo total de dados.

Observando a Tabela 2, nota-se que as va-riáveis:

V01 - Mortalidade Proporcional para Meno-res de 5 anos

V02 - Mortalidade Proporcional para Maio-res de 50 anos (Coeficiente de Swaro-op-Uemura)

V03 - Coeficientes de Mortalidade InfantilTardia

V04 - Coeficiente de Mortalidade Infantil

* Dados inéditos** Da Secretaria da Saúde e Meio Ambiente do RS.

apresentam o total máximo de 4 bons coefi-cientes de correlação.

A variável V07 — Mortalidade Proporcio-nal por Doenças Infecciosas e Parasitáriasapresenta 3 bons coeficientes de correla-ção.

Ainda, estas 5 variáveis estão altamentecorrelacionadas entre si, sendo a variávelMortalidade Proporcional para Menores de5 anos (V01) a que apresenta os mais altosvalores.

Nota-se, portanto, que as variáveis quemedem mortalidade parecem ser medidasdiscriminantes de um conjunto de dados deSaúde dos municípios do nosso Estado.

A variável V05, % crianças com Peso aoNascer Menor que 2.700g, para nosso Esta-do, é a menos discriminante ou diagnóstica

com relação ao conjunto total das variáveis.

Análise Fatorial

O subprograma "FACTOR" fornece asraízes características da matriz de correlaçãobem como a matriz de cargas fatoriais. Paraa obtenção dos Fatores utilizou-se o métodode rotação VARIMAX, que foi selecionadopor proporcionar uma melhor interpretaçãodos Fatores, visto que o objetivo da rotaçãodos fatores é obter uma matriz de cargasmais facilmente interpretáveis ou mais iden-tificáveis com relação a natureza das variá-veis observadas4,9.

Obtiveram-se 5 Fatores associados às raí-zes características maiores do que a unidade(Tabela 3).

Nota-se que 76,6% da variância totaldas 14 variáveis observadas é explicada ape-nas por 5 fatores, representando um altograu de conservação de informação original.

A matriz fatorial rotada VAREVIAX (Ta-

bela 4) é então obtida e a partir das cargasfatoriais (correlação entre as variáveis e osnovos fatores), tem-se a seguinte composi-ção dos Fatores:

O Fator l é uma componente que agregavariáveis que indicam o nível de saúde de ummunicípio, representando a parte comummais importante das variáveis analisadas epode ser denominada "índice do Nível deSaúde". As mais importantes (mais altascargas fatoriais) variáveis agregadas por esteíndice são todas de mortalidade e observa-seque as informações contidas nestas variáveis,antes de mais nada, expressam a condição desaúde de um município. A principal variáveldeste índice é a Mortalidade Proporcionalpara Menores de 5 anos. Em texto para dis-cussão sobre Indicadores para a Monitoriza-ção do Progresso Visando a Saúde, publicadopela Organização Mundial de Saúde (1980)n ,encontra-se o seguinte comentário sobre estavariável:

"Usar somente a taxa de mortalidade in-fantil (menores de l ano) pode não chamara atenção de forma suficiente para a elevadamortalidade das crianças mais velhas. Os pro-

blemas da má nutrição, em particular, po-dem não receber atenção suficiente comoum fator causai, em especial naqueles paí-ses onde a criança de dois anos de idade émais vulnerável a ela".

"Em alguns países menos desenvolvidos,as mortes antes de cinco anos de idade sãoresponsáveis por até 60% dos óbitos totais,e por níveis tão baixos quanto 3% nos paí-ses mais ricos. Este indicador reflete tambémas taxas mais elevadas de nascimentos e aproporção mais elevada de população nestafaixa etária nos países menos desenvolvidos;este fato é por si só um outro indicador indi-reto dos níveis de saúde. A proporção do to-tal de mortes em que se encontrem criançasde idade inferior a cinco anos é, portanto,um indicador composto que reflete as altastaxas de mortalidade da criança, altas taxasde nascimento, e o encurtamento da expec-tativa de vida".

As três principais variáveis deste fator su-gerem claramente ser este um fator de cober-tura vacinal (ou Assistência Preventiva), po-

dendo ser denominado um "índice de Imu-nização".

Dada a natureza das mais importantes va-riáveis ligadas ao Fator 3 pode-se interpre-tá-lo como um "índice de Não Assistência

Médico-Hospitalar". Na variável V09 estãoincluídos os óbitos seiri assistência médica.

As mais importantes variáveis do Fator 4dizem respeito ao número de casos de umadoença, sugerindo, portanto, um "índice de

Morbidade". Poderia ser um "índice de Mor-bidade de Sarampo", já que considera ape-nas esta doença.

Das duas variáveis com as mais altas car-gas contidas neste Fator, a primeira indica oestado nutricional da criança (e indiretamen-te da mãe) e a segunda o coeficiente de inci-dência por tuberculose, que se apresentamaior na parte da população mais carente.

Portanto, variáveis associadas à condição so-cial.

Cabe salientar que a interpretação dos Fa-tores é subjetiva na análise, ou seja, o nomedado aos Fatores depende de um ponto devista subjetivo, e que em muitas situações

torna-se difícil esta interpretação; e que,embora para cada Fator apresentado tenhamsido colocadas apenas as variáveis mais im-portantes na sua composição, todas as variá-veis entram, com coeficientes maiores oumenores, na formação dos Índices.

Passou-se, a seguir, à obtenção dos escoresfatoriais de cada componente para cada mu-nicípio. O programa fornece uma matriz on-de cada escore é padronizado tendo médiaigual a 0 e variância igual a 1.

Utilizando o Fator 1, passou-se a traba-lhar com os valores do Índice do Nível deSaúde para cada município.

Quanto mais elevado é o valor do escore,mais baixo é o nível de saúde do município,segundo o índice proposto. Assim, os maisaltos valores foram observados para os se-guintes municípios:

O programa do computador fornece apercentagem de perda de informação paracada etapa de grupamento. Colocados emum gráfico estes valores, um possível corte équando a curva cresce mais rapidamente, ha-vendo um "salto" maior entre estes valores.

A linha de corte foi feita na etapa 213, oque corresponde a um valor de 2,12% deperda de informação. Observou-se que a li-nha de corte é subjetiva, mesmo utilizandocritérios como o que foi exposto anterior-mente.

Os grupos formados a partir da análise sãodescritos a seguir, em ordem de grandeza dosescores do índice do Nível de Saúde: o grupoI formado pelo(s) município(s) com baixosníveis de saúde e sucessivamente até o grupoXVIII formado pelos municípios com osmais altos níveis de saúde.

Nesta etapa é utilizada a técnica de Aná-lise de Agrupamento com o objetivo de for-mar grupos homogêneos com relação ao Ín-dice do Nível de Saúde.

Análise de Agrupamento

Considerou-se o algoritmo que procede oagrupamento obtendo uma "árvore hierár-quica de vínculos" ("linkage tree"), que co-meça com tantos grupos quanto as unidadesobservadas (cada município é um grupo) etermina com um só grupo que inclui todasas unidades.

Quando as unidades observadas vão sen-do combinadas em grupos crescentementeheterogêneos, mais e mais o detalhe inicialé perdido. O ponto principal é a escolha deuma linha de corte que indique um conjun-to significativo de grupos.

Grupo I: Santo Augusto, Severiano de Al-meida, Cândido Godoi, Iraí

Grupo II: São José do NorteGrupo III: Mariano Moro, Sobradinho, San-

tana do Livramento, Humaitá, Frede-rico Westphalen

Grupo IV: Chiapeta, Portão, AlegreteGrupo V: Pejuçara, Tramandaí, Quaraí, Es-

tância Velha, Itaqui, Ilópolis, Alvora-da, Palmitinho, Camaquã

Grupo VI: Sapucaia do Sul, Tenente Porte-la, Rosário do Sul, Viamão, Itatibado Sul, Rio Grande, Uruguaiana, Pla-nalto, Ciríaco, Passo Fundo

Grupo VII: Nova Palma, Faxinal do Sotur-no, Caiçara, Espumoso, Mata, Tapes,Jaguarão, Tapera, Erexim, Júlio deCastilhos, Sertão, São Valentim, BomJesus

Grupo VIII: Soledade, Canoas, São Leopol-do, Guaíba, Seberi, Santiago, Canela,Rodeio Bonito, Ibiraiaras, Porto Lu-cena, Igrejinha, Lagoa Vermelha, SãoFrancisco de Paula, Bossoroca, DomPedrito, Cacequi, Redentora, Jacutin-ga, Cachoeirinha, Nonoai, Erval Gran-de, São José do Ouro, Bagé

Grupo IX: Paraí, Três Passos, Tuparendi,Santo Cristo, Santo Angelo, Macha-

dinho, Sapiranga, Nova Prata, Maxi-miliano de Almeida, Caxias do Sul,Palmeira das Missões, Carazinho,Campo Bom, Pedro Osório, Lavrasdo Sul, Esmeralda, São Borja, Antô-nio Prado

Grupo X: Barros Cassal, Arroio do Tigre,Tucunduva, Porto Xavier, São Lou-renço do Sul, Butiá, São Jerônimo,Nova Araçá, Novo Hamburgo, Cam-po Real (Não-Me-Toque), Cruz Alta,Gravataí, Campinas do Sul, SantaCruz do Sul, Campo Novo, RoqueGonzales, Panambi, Ijuí, Vacaria, Ca-çapava do Sul

Grupo XI: Jaguari, Torres, Sarandi, PortoAlegre, São Vicente do Sul, São Se-pe, Augusto Pestana, Mostardas, Gua-poré, Alpestre, General Câmara, Ba-rão do Cotegipe, Alecrim, Três Co-roas, São Gabriel, São Martinho,Triunfo, Getúlio Vargas, Constantina,Arroio dos Ratos, Tupanciretã, Bar-racão, Ivoti, Viadutos, Erval Seco,Canguçu

Grupo XII: Santo Antônio da Patrulha, BoaVista do Buricá, São Luiz Gonzaga,Osório, Liberato Salzano, Giruá, In-dependência, Esteio, Victor Graeff,Braga, Encruzilhada do Sul, SantaMaria, Guarani das Missões, Candelá-ria, Gramado, Colorado, Cerro Largo,Casca, Lageado, Arroio Grande, Ca-choeira do Sul, Cacique Doble, Far-roupilha, Rondinha, São Pedro doSul, Rolante, Barra do Ribeiro, SantaVitória do Palmar, São Paulo das Mis-sões, Nova Brescia, Taquara, SantaRosa, Vicente Dutra, Dois Irmãos,Fontoura Xavier, Venâncio Aires,São Francisco de Assis, Agudo

Grupo XIII: Marcelino Ramos, Horizontina,Três de Maio, Salvador do Sul, SãoMarcos, Flores da Cunha, Coronel Bi-caco, Pinheiro Machado, Montene-gro, Rio Pardo, Ibirubá, São Sebas-

tião do Caí, Putinga, Paim Filho,Crissiumal, Campinas das Missões,São Nicolau, Pelotas, Cambará doSul, Tapejara, Ibiaçá, Dona Francis-ca, Taquari, Dom Feliciano, Marau,Ajuncaba, Gaurama, Chapada, Ron-da Alta, Santa Bárbara do Sul, Ben-to Gonçalves.

Grupo XIV: Sanaduva, Vera Cruz, Condor,Garibaldi, Santana da Boa Vista, For-migueiro, Restinga Seca, Miraguai,Encantado, Caibaté, Bom Retiro doSul.

Grupo XV: Anta Gorda, Veranópolis, Estre-la, Muçum, Catuípe.

Grupo XVI: Nova Petrópolis, Arvorezinha,Piratini, Arroio do Meio, Selbach,Cruzeiro do Sul, Serafina Corrêa,Herval do Sul, Carlos Barbosa, Arati-ba.

Grupo XVII: Santo Antônio das Missões,David Canabarro, Roca Sales.

Grupo XVIII: Nova Bassano e Feliz.

A Figura apresenta a localização geográ-fica dos grupos de municípios que apresen-taram maior carência nas condições de saú-de.

Nota-se que as zonas de piores condiçõesde saúde são municípios de minifúndios(norte do Estado), a região da campanha(municípios latifundiários), municípios lito-râneos e alguns municípios da Região Me-tropolitana de Porto Alegre.

Em geral os municípios da Região Serra-na do Estado apresentam-se como os de me-lhores condições.

Na utilização do teste X2 para verificara associação entre o grupo a qual o muni-cípio pertence e o tamanho do município(considerando sua população) foi encontra-da não significância (0,10 < p < 0,20), ouseja, não existe associação. Esta é uma com-provação importante para o tipo de variáveisutilizadas.

CONCLUSÕES

Utilizando a técnica de Análise Fatorialque simplificou a informação contida nasvariáveis observadas, relacionadas com a áreade Saúde Pública, obteve-se o índice do Ní-vel de Saúde.

Aos valores deste índice para os municí-pios do Estado do Rio Grande do Sul, foiaplicada a técnica de Análise de Agrupamen-to formando dezoito grupos de municípios.Estes grupos são caracterizados por possuí-rem homogeneidade interna e por serem

diferenciados entre si, ao máximo.

Analisando os demais Fatores foram obti-dos outros índices que ficaram assim deno-minados:

- Índice de Imunização (Fator 2)- Índice de Não Assistência Médico-Hos-

pitalar (Fator 3)Este trabalho servirá de grande valia em

atuações práticas na área de Saúde Públicado Estado. Assim, por exemplo, foram apre-

sentados os municípios que merecem maioratenção para a melhoria do seu nível de saú-de. Sugeriu-se a utilização do Índice do Nívelde Saúde como um indicador composto (queguarda em si a informação de todas as variá-veis) e por isso mais completo para avaliara saúde dos municípios, e a maior atenção avariáveis importantes (como MortalidadeProporcional para Menores de 5 anos) porserem de maior poder de diagnóstico e maisdiscriminantes que outras menos diagnósti-

cas (como % de Peso ao Nascer Menor que2.700g.) para nosso Estado.

Ao se apresentar a hierarquização dos mu-nicípios do Estado do Rio Grande do Sul,em grupos homogêneos, possibilitará umcontrole da melhoria dos municípios quantoa saúde e a sua assistência no decorrer dosanos. Este controle e avaliação vem ao en-contro às metas mínimas regionais de saúdeapresentadas pela Organização Panamericanada Saúde12.

POSSOLI, S. [Multivariate analysis techniques for the assessment of the health status of the"counties" of State of Rio Grande do Sul, Brazil]. Rev. Saúde públ., S. Paulo, 18: 288-300,1984.

ABSTRACT: The correlation structure of variables in the Public Health field were studiedin order to obtain a "Health Status Index" for the "counties** (municípios) of Rio Grande doSul State. By using the value of this index for each one of the counties it was possible to builtup 18 homogeneous groups (Clusters) which were ordered in the reverse magnitude of theirhealth status index. Additional indices were found: "Imunization Index" and "Non-Medical--Hospital Care Index". The variable proporcional mortality for the under 5 year-olds, was theone that showed itself to be the most sensive diagnostic discriminator among the series ofvariables that were studied, and the birth weight of less than 2,700g the least sensitive.

UNITERMS: Health Status Index. Counties of Rio Grande do Sul, health conditions. Mul-tivariate analysis.

REFERÊNCIAS BIBLIOGRÁFICAS

1. CAMINHA, J. A. et al. Indicadores de saúde.Rev. Med. ATM, Porto Alegre, 9: 25-9,1974.

2. CHATFIELD, C. & COLLINS, A. J. Introduc-tion to multivariate analysis. London, Me-phuen, 1980.

3. EVERITT, B. Cluster analysis. London, Heine-mann Educational Books, 1974.

4. FACHEL, J. M. G. Análise fatorial. São Paulo,1976. [Dissertação de Mestrado - Institutode Matemática USP]

5. FUNDAÇÃO IBGE. Censo demográfico: RioGrande do Sul, 1970. Rio de Janeiro, 1970.(Recenseamento Geral do Brasil, 8o, 1970,Série Regional, v. 1, t. 21).

6. FUNDAÇÃO IBGE. Censo demográfico - da-dos gerais, migração, instrução, fecundidade,mortalidade: Rio Grande do Sul, 1980. Riode Janeiro, 1982. (Recenseamento Geral doBrasil, 9o, 1980, v. 1, t. 4, n. 22).

7. HOTELLING, H. Analysis of a complex of sta-tistical variables into principal components.J. educ. Psychol, 24: 417-41, 490-520,1933.

8. MAXWELL, A. E. Multivariate analysis in be-havioral research. London, Chapman andHall, 1977.

9. MORRISON, D. F. Multivariate statistical me-thods. New York, McGraw-Hill, 1976.

10. NIE, N. et al. Factor analysis. In: Nie, N. et al.Statistical Pachage for Social Sciences. NewYork, McGraw-Hill, 1978. p. 468-97.

11. ORGANIZAÇÃO MUNDIAL DA SAÚDE.Indicadores para a monitorização do pro-gresso visando a saúde; Documento do Co-mitê Executivo da Organização Mundial deSaúde. Genebra, 1980.

12. ORGANIZACION PANAMERICANA DE LASALUD. Salud para todos en el año 2.000:plano de accion para la instrumentacion delas estrategias regionales. Washington, D.C., 1982. (Documento Oficial No 179).

300

13.WARD apud EVERITT, B. Cluster analysis.London, Heinemann Educational Books,1974.

Recebido para publicação em 14/09/1983Reapresentado em 28/05/1984

Aprovado para publicação em 06/06/1984

E R R A T A

REVISTA DE SAÚDE PÚBLICA,18(2), 1984

p. 131, Tabela 6 - última linhaOnde se lê: Sintomas. . .Leia-se: Demais grupos

18(4), 1984.p.300, Referência Bibliográfica n° 13

Onde se lê: 13. WARD apud EVERITT, B. Cluster analysis. London, Heinemann Educa-tional Books, 1974.

Leia-se: 13. WARD Jr., J. H. Hierarchical grouping to optimize an objective function. J.Amer. Statist. Assoc. 58:236-44, 1963.

O arquivo disponível sofreu correções conforme ERRATA publicada no Volume 23 Número 1 da revista.O arquivo disponível sofreu correções conforme ERRATA publicada no Volume 23 Número 1 da revista.

O arquivo disponível sofreu correções conforme ERRATA publicada no Volume 18 Número 5 da revista.