Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS...

24
Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS [email protected]

Transcript of Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS...

Page 1: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

Relacionamento Nominal de Banco de Dados

Record Linkage

Jussara Macedo Rötzch - GGSUS/DIDES/[email protected]

Page 2: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

2

A Visão da DIDES/GEPIS

Melhorar a comparabilidade, qualidade, integridade e a

utilidade da informação em saúde suplementar, a partir

da integração de uma ampla variedade de fontes de

informação e recursos públicos e privados em todos os

níveis (local, regional, nacional e internacional) através

da adoção de uma política de informação

uniforme e de uso de padrões.

Page 3: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

3

PROCESSO DE LINKAGE

• O processo de linkage:

coleta informações e pesquisa unidades de observação de duas ou mais fontes diferentes com o objetivo de combinar dados.

é uma técnica importante para o desenvolvimento, produção, análise e avaliação de dados estatísticos.

um de seus primeiros usos foi na pesquisa do câncer.

esta técnica auxilia na produção de grandes bancos de dados para estudos prospectivos observacionais.

pode ser considerada uma técnica estatística em virtude da falta de padronização dos diferentes bancos de dados. Assim, as informações são conseguidas a partir de inferências.

Page 4: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

4

Propósito do Record Linkage

Record linkage é uma técnica de integração entre sistemas existentes, combinando dados de 2 bancos de dados ou mais, verificando a sobreposição desses dados, construindo assim um data warehouse.

Linkar registros pessoais acuradamente é difícil, mesmo quando os dados estão adequados; é extremamente complexo quando os dados são anônimos, como nos registros dos sistemas de dados vitais.

Alguns países utilizam identificação de registros pessoais que podem ser utilizados na técnica de linkage (social security number nos EUA e número nacional na Nova Zelândia), embora deva haver preocupação com a individualidade do cidadão.

(Musen & van Bemmel, 1997)

Page 5: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

5

Record Linkage na ANS

R e ssa rc im e n to E p ide m io lo g ia

T é cn ica s d e R e cord L inka ge

Page 6: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

6

Epidemiologia

• Refere-se aos estudos retrospectivos e prospectivos da distribuição e dos determinantes da prevalência das doenças em pessoas e animais, envolvendo o estudo dos fatores que propiciam a ocorrência das doenças, inquéritos e investigação epidemiológica.

• Inclui subtemas como:

— análise da situação de saúde,

— estrutura epidemiológica de grupos populacionais,

— bioestatística,

— métodos epidemiológicos,

— sistemas de informação em saúde,

— indicadores de saúde,

— estudos populacionais,

— estatística vital,

— epistemologia em epidemiologia,

— determinantes da saúde e da doença, etc.

Page 7: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

7

SIEPI

O Sistema de Informações Epidemiológicas (SIEPI) é um banco de dados de uso interno na ANS cujo objetivo é conhecer a situação de saúde da população beneficiária de planos privados de saúde, fornecendo subsídios para que o Sistema Único de Saúde (SUS) conheça e promova melhorias no setor, desenvolvendo e fomentando políticas e estratégias voltadas às ações de proteção e promoção à saúde da população.

Page 8: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

8

SIEPI

• A captação dos dados para a construção dos indicadores epidemiológicos sobre a situação de saúde da população beneficiária de planos privados é realizada a partir de grandes bancos de dados nacionais ao cruzar com os sistemas de informação da ANS.

• Grandes bancos de dados nacionais: SIH, SINASC, SIM, SINAN, APAC, SIAB

• Banco de dados da ANS: SIB – Sistema de Informações de Beneficiários

• Utiliza a técnica de Record Linkage

Page 9: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

9

SIEPI e record linkage

SIEPIBanco de Dados

para análise

SIBSistema de Informações

de Beneficiários

SIH-SUS

SINASC

Bancos do MSANSOperadoras

RECORD LINKAGE

SIM

CIH

Page 10: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

10

Record linkage do SIB com o SIH-SUS

Sistema de Informações Hospitalares do SUS

• O SIH-SUS contém informações que viabilizam efetuar o pagamento dos serviços hospitalares prestados pelo SUS, através da captação de dados em disquete das Autorizações de Internação Hospitalar - AIH - relativas a mais de 1.300.000 internações/mês.

• Sendo o sistema que processa as AIHs, dispõe de informações sobre recursos destinados a cada hospital que integra a rede do SUS, as principais causas de internações no Brasil, a relação dos procedimentos mais freqüentes realizados mensalmente em cada hospital, município e estado, a quantidade de leitos existentes para cada especialidade e o tempo médio de permanência do paciente no hospital.

Fonte:DATASUS

Page 11: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

11

SIEPI e record linkage do SIB com o SIMSistema de Informações sobre Mortalidade (SIM)

Coleta dados sobre óbitos e fornece informações sobre o

perfil de mortalidade nos diferentes níveis do SUS.

Permite que os dados sejam agregados ou desagregados

por estados, município, bairro ou endereço residencial.

• Record Linkage (conhecido como “Batimento”):

SIM – 2002, 2003 e 2004

SIB – fevereiro/2006

Page 12: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

12

SIEPI e record linkage do SIB com o SIM

Registro no SIB

Registro no SIM

Adelina Fernandez F 05/05/45 Maria Portela Souza

Adelina Maria Fernandez F 05/05/44 Maria Portela Souza

NOME - SEXO - DATA DE NASCIMENTO – NOME DA MÃE

Fonetização do nome: primeiro nome + último nome + nome do meioADELINAFERNANDEZMARIA MARIASOUZAPORTELAcompara os 7 primeiros caracteres

Page 13: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

13

SIEPI e record linkage do SIB com o SIM

• Números de registros do SIB e do SIM:

SIB: 123.129.176 (ativos e inativos)

SIM-2002:  958.380 (retirados os inválidos)

SIM-2003: 979.548 (retirados os inválidos)

SIM-2004: 1.000.489 (retirados os inválidos)

• Maiores dificuldades:

duplicidade de registros e ausência de dados

homônimos

mesmos beneficiários em diversos planos

grafias incorretas nos nomes (abreviaturas, variações)

diagnósticos diferenciados do mesmo óbito.

Page 14: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

14

SIEPI e record linkage do SIB com o SIM

• SIB e SIM são bases que não possuem identificações unívocas em comum (CPF, RG).

• Principais etapas para o batimento:

1 - Padronização dos nomes dos beneficiários , fonetizando-os, de forma a poder-se efetuar uma comparação onde erros de grafia não influam, causando falsos não-batimentos.

2 - Padronização das datas e do sexo do beneficiário.

3 - Blocagem sobre as seguintes informações: sexo, data de nascimento e os 7 (sete) primeiros caracteres do nome fonetizado

4 - Batimento e pontuação dos pares

Page 15: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

15

SIEPI e record linkage do SIB com o SIM

• Sistema de Pontuação:

A - Nome Fonético Completo – 100 pontos

B – Nome Fonético da mãe - > 80% - 20 pontos

C – UF:igual – 5 pontos

Page 16: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

16

Resultados analisados e disponibilizados no SIEPI SIB x SIM

• As informações estão agrupadas (Data Warehouse/ANS) nos seguintes temas:

dados demográficos, onde são apresentadas as AIH identificadas distribuídas por UF, sexo, faixa etária e classificação da operadora;

acesso e utilização de serviços de saúde, com informações sobre o procedimento principal realizado no SUS, a especialidade do procedimento principal e a especialidade da AIH identificada;

morbidade, com o diagnóstico principal da internação, agrupados por lista tabular de morbidade da CID10 e grupo de causa da CID10

mortalidade hospitalar, onde são apresentados os óbitos hospitalares identificados em AIH do SUS.

Page 17: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

17

SIEPI 2003 – SEXO E FAIXA ETÁRIA

• De acordo com os dados, observamos que praticamente a metade dos óbitos ocorreram em usuários com mais de 70 anos. Incluindo a faixa imediatamente anterior (60-69 anos), esta proporção chega a 65%.

• Há maior proporção de óbitos para o sexo masculino em praticamente todas as faixas etárias, com exceção da faixa de mais de 70 anos.

• Interessante observar a grande discrepância de óbitos em beneficiários jovens do sexo masculino em relação às jovens do sexo feminino. Este achado é compatível com a distribuição de óbitos na população geral.

Page 18: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

18

SIEPI 2003 – GRUPO DE CAUSA E SEXO

 Periodo: Janeiro de 2003 à Dezembro de 2003

 Nº Óbito   %   Nº Óbito   %   Nº Óbito   % 

I - Algumas doenças infecciosas e parasitárias 2937 4,5 2083 4,1 5.020 4,3

I I - Neoplasias 12486 19,2 11024 21,9 23.510 20,3

I X - Doenças do aparelho circulatório 19650 30,1 16779 33,3 36.429 31,5

X - Doenças do aparelho respiratório 6925 10,6 6087 12,1 13.012 11,3

XI - Doenças do aparelho digestivo 3592 5,5 2268 4,5 5.860 5,1

XI V - Doenças do aparelho geniturinário 1221 1,9 1232 2,4 2.453 2,1

XV - Gravidez, parto e puerpério - - 106 0,2 106 0,1XVI - Algumas afecções originadas no período perinatal 145 0,2 123 0,2 268 0,2XVI I - Malformações congênitas, deformidades e anomalias cromossômicas 299 0,5 304 0,6 603 0,5XVI I I - Sintomas, sinais e achados anormais de exames clínicos e de laboratório, não classificados em outra parte 3189 4,9 2661 5,3 5.850 5,1XX - Causas externas de morbidade e de mortalidade 9727 14,9 2348 4,7 12.075 10,4

Total 65.189 56,39 50.418 43,61 115.607 100

Grupo de Causa da CI D 10

Sexo

  total   Masculino   Feminino 

Page 19: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

19

SIEPI 2003 – GRUPO DE CAUSA E SEXO

• A análise dos dados disponíveis no SIEPI demonstra uma maior prevalência de óbitos por doenças circulatórias, neoplasias, doenças respiratórias e causas externas.

• Houve alguma diferença em relação ao sexo quanto aos óbitos por neoplasias (mais mulheres) e por doenças circulatórias (mais mulheres).

• Houve uma grande discrepância quanto ao sexo no grupo de causas externas – muito mais homens que mulheres, seguindo a tendência da população em geral.

Page 20: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

20

SIEPI 2003 – GRUPO DE CAUSA E REGIÃO

Norte % Nordeste % Sudeste % C. Oeste % Sul %No.

ObitosI - Algumas doenças infecciosas e parasitárias 116 4,94 629 4,38 3.559 4,35 229 4,74 487 3,97 5.020

I I - Neoplasias 429 18,27 2.612 18,19 16.642 20,34 943 19,52 2.884 23,53 23.510IX - Doenças do aparelho circulatório 679 28,92 4.238 29,52 26.138 31,95 1.564 32,37 3.810 31,08 36.429X - Doenças do aparelho respiratório 252 10,73 1.605 11,18 9.589 11,72 444 9,19 1.122 9,15 13.012XI - Doenças do aparelho digestivo 121 5,15 722 5,03 4.115 5,03 261 5,40 641 5,23 5.860XIV - Doenças do aparelho geniturinário 51 2,17 294 2,05 1.802 2,20 110 2,28 196 1,60 2.453XV - Gravidez, parto e puerpério 5 0,21 20 0,14 64 0,08 5 0,10 12 0,10 106XVI - Algumas afecções originadas no período perinatal 6 0,26 22 0,15 196 0,24 15 0,31 29 0,24 268

XVI I I - Sintomas, sinais e achados anormais de exames clínicos e de laboratório, não classificados em outra parte 191 8,13 1.269 8,84 3.838 4,69 125 2,59 427 3,48 5.850

XX - Causas externas de morbidade e de mortalidade 259 11,03 1.504 10,47 8.221 10,05 642 13,29 1.449 11,82 12.075

Total 2.348 100,00 14.358 100,00 81.811 100,00 4.832 100,00 12.258 100,00 115.607

Grupo de Causa da CID 10

Região Geográfica Total

Page 21: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

21

SIEPI 2003 – GRUPO DE CAUSA E REGIÃO

• Os dados demonstram algumas diferenças entre as regiões:

as regiões Sul e Sudeste possuem maior proporção de óbitos por neoplasias;

as regiões Norte e Nordeste apresentam menores proporções de óbitos por doenças circulatórias;

óbitos relacionados à gravidez têm proporção maior na região Norte;

causas mais definidas são mais comuns nas regiões Norte e Nordeste;

causas externas são mais comuns na região Centro-Oeste.

Page 22: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

22

PRÓXIMOS TRABALHOS

• Novos record linkages (SIB x SINASC)

• Ampliar parceria com a SVS/MS

• Estudos para validação do algoritmo (comparação com o LinkPlus – CDC (Centers for Disease Control and Prevention – www.cdc.gov - Department of Health and Human Services - Estados Unidos)

• Maior disseminação da técnica em congressos e universidades

Page 23: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.

23

IMPORTÂNCIA DA QUALIDADE DA INFORMAÇÃO

• Existem dificuldades com a falta de padronização dos dados dos grandes bancos (DATASUS e ANS).

• Esta deficiência faz com que as informações obtidas tenham vieses, dificultando a interpretação dos dados.

• O projeto TISS – Troca de Informações em Saúde Suplementar objetiva suprir a deficiência de falta de padronização na saúde suplementar.

Page 24: Relacionamento Nominal de Banco de Dados Record Linkage Jussara Macedo Rötzch - GGSUS/DIDES/ANS jussara.macedo@ans.gov.br.