Como se familiarizar com seu banco de dados usando o SPSS

Post on 22-Jan-2016

22 views 0 download

description

Como se familiarizar com seu banco de dados usando o SPSS. Profa. Suzi Camey Depto de Estatística - UFRGS. Construção de BD. O banco de dados (BD) pode ser construído diretamente no SPSS ou em qualquer tipo de planilha eletrônica (como por exemplo Excel) - PowerPoint PPT Presentation

Transcript of Como se familiarizar com seu banco de dados usando o SPSS

Como se familiarizar com seu banco de dados

Como se familiarizar com seu banco de dados usando o

SPSSProfa. Suzi Camey

Depto de Estatística - UFRGS

Como se familiarizar com seu banco de dados

Construção de BD

• O banco de dados (BD) pode ser construído

diretamente no SPSS ou em qualquer tipo de

planilha eletrônica (como por exemplo Excel)

– Principal desvantagem: ausência de um sistema

de controle de entrada de dados

– Alternativa: EpiData que pode ser obtido

gratuitamente no endereço

• http://www.epidata.dk/

Como se familiarizar com seu banco de dados

Construção de BD

• Usando o Excel lembrar que:

– Colocar o nome de cada variável na primeira linha

da planilha;

– Cada linha representa um sujeito;

– Cada coluna uma variável;

– Dados perdidos (missing): é mais fácil deixar a

casela vazia;

– Não colocar letras em colunas destinadas à

variáveis numéricas.

Como se familiarizar com seu banco de dados

Construção de BD• Usando o Excel lembrar que:

– Cada variável só pode aparecer uma vez no banco, não

podendo haver 2 colunas com o mesmo nome.

– Não incluir no nome de uma variável acentos, cedilhas,

espaços ou caracteres especiais (%, vírgulas, pontos, *,

& ...), pois dependendo da versão do SPSS, eles serão

lidos de um jeito diferente.

– Mesmo já existindo a numeração padrão do excel, deve

existir uma coluna enumerando os casos no arquivo.

Como se familiarizar com seu banco de dados

Construção de BD• Usando o Excel lembrar que:

– Para facilitar a digitação, algumas linhas e algumas

colunas podem ficar “fixas” na planilha. Por exemplo se

você quer fixar o nome do paciente (coluna b) e o nome

das variáveis (linha 1), então deve colocar o cursor na

célula C2 e clicar em “Janela” no menu superior, e depois

em “congelar painéis”. Neste caso, em qualquer ponto da

planilha que você estiver, sempre aparecerá o nome do

paciente e o nome da variável.

Como se familiarizar com seu banco de dados

Construção de BD

• O ideal é que daqui em diante os próximos

passos sejam executados no arquivo

milsa.xls

Como se familiarizar com seu banco de dados

Iniciando o SPSSQuando abrimos o SPSS ele tem a seguinte aparência:

Clicar aqui

Como se familiarizar com seu banco de dados

Lendo dados do ExcelEscolher tipo de arquivo

Clicar aqui

Como se familiarizar com seu banco de dados

Lendo dados do ExcelEscolher tipo de arquivo

Clicar aqui

Como se familiarizar com seu banco de dados

Lendo dados do ExcelEscolher arquivo: primeiro escolher o subdiretório onde o arquivo se encontra.

Clicar 2x aqui

Como se familiarizar com seu banco de dados

Lendo dados do ExcelEscolher a planilha

Escolher esta opção se houver o nome das variáveis na 1a. linha do arquivo Excel

Aqui pode ser escolhida a planilha do arquivo Excel

Clicar aqui

Como se familiarizar com seu banco de dados

Definições: pelo MenuRótulos das variáveis e categorias, no. de casas decimais e dados perdidos

Clicar aqui

Como se familiarizar com seu banco de dados

Definições: pelo MenuRótulos das variáveis

Nesta coluna podemos colocar os rótulos das variáveis. Basta clicar em uma das caselas e digitar o rótulo.

Como se familiarizar com seu banco de dados

Definições: pelo MenuRótulos das variáveis

Neste exemplo ficaria assim

Como se familiarizar com seu banco de dados

Definições: pelo Menu• Rótulos das categorias

Nesta coluna podemos colocar os rótulos das categorias.Clicando na 2a. casela.

Como se familiarizar com seu banco de dados

Definições: pelo MenuRótulos das categorias

Clique aqui

Como se familiarizar com seu banco de dados

Definições: pelo MenuRótulos das categorias

Aqui digite o rótulo

Aqui digite o valor

Como se familiarizar com seu banco de dados

Definições: pelo MenuRótulos das categorias

Para a variável civil fica assim.

Após adicionar cada “Value” e seu “Label” deve-se clicar aqui.

Como se familiarizar com seu banco de dados

Definições: pelo Menu

Rótulos das categorias: colocar rótulos das variáveis abaixo.

• Instrução: – 1: Ensino Fundamental– 2: Ensino Médio– 3: Superior

• Região:– 1: capital– 2: interior

Como se familiarizar com seu banco de dados

Definições: pelo MenuCasas decimais

Nesta coluna podemos definir o no. de casas decimais. Basta clicar em uma das caselas e digitar o no. de casas decimais ou usar as setas.

Como se familiarizar com seu banco de dados

Definições: pelo MenuDados perdidos

Nesta coluna podemos definir quais são os códigos para valores perdidos.

Como se familiarizar com seu banco de dados

Definições: pelo MenuDados perdidos

Clicar aqui

Como se familiarizar com seu banco de dados

Definições: pelo MenuDados perdidos

Podem ser definidos até 3 valores diferentes.No nosso exemplo o valor perdido é definido pelo número 9.

Como se familiarizar com seu banco de dados

Definições: pela sintaxeAgora vamos definir rótulos das variáveis e

categorias, no. de casas decimais e dados perdidos construindo um arquivo de sintaxe.

Esse método é útil principalmente quando se pretende fazer análises parciais do banco de dados, pois cada vez que lemos um BD do Excel temos que reaplicar as definições.

Como se familiarizar com seu banco de dados

Definições: pela sintaxe

Clicar aqui

Como se familiarizar com seu banco de dados

Definições: pela sintaxe

Esta é a janela do arquivo de sintaxe.

O arquivo de sintaxe pode ser construído em qualquer editor de texto e é conveniente que seja salvo com a terminação .sps

Como se familiarizar com seu banco de dados

Definições: pela sintaxe

Nomes dos comandos

Como se familiarizar com seu banco de dados

Definições: pela sintaxe

Nomes das variáveis a serem definidas

Como se familiarizar com seu banco de dados

Definições: pela sintaxe

Número da categoria

Código do valor perdido

Nome da categoria

Rótulo da variável

Como se familiarizar com seu banco de dados

Definições: pela sintaxe

Os rótulos devem estar entre aspas simples e o código do dado perdido está entre parênteses.

Agora você deve definir os rótulos de variáveis e categorias para todas as variáveis!

Todos os comandos devem terminar com ponto final.

Como se familiarizar com seu banco de dados

Definições: pela sintaxe

Clicando aqui após selecionar o comando com o mouse, o comando será executado.

Como se familiarizar com seu banco de dados

Definições: pela sintaxe

Lembrar de salvar a sintaxe!

Como se familiarizar com seu banco de dados

Lembrar de salvar o banco de dados!

Como se familiarizar com seu banco de dados

“Limpeza” do BD

• Após colocar todos os rótulos e definir quais são os valores perdidos devemos fazer uma distribuição de freqüências de todas as variáveis para detectar possíveis erros de digitação.

Como se familiarizar com seu banco de dados

“Limpeza” do BD

Clicar aqui

Como se familiarizar com seu banco de dados

“Limpeza” do BD

• Clicar aqui depois de selecionar todas as variáveis com o mouse.

• Depois clicar em OK.

Como se familiarizar com seu banco de dados

“Limpeza” do BD

• Quando esse comando é executado, uma nova janela é aberta: a janela de resultados.

Como se familiarizar com seu banco de dados

“Limpeza” do BD

• Aqui temos todas as variáveis analisadas, o número de casos válidos e o número de casos perdidos.

• Por exemplo: temos 13 observações perdidas na variável “Região onde mora” e 23 observações válidas.

Como se familiarizar com seu banco de dados

“Limpeza” do BD

• Agora vamos fazer uma análise de cada uma

das variáveis buscando inconsistências.

Como se familiarizar com seu banco de dados

“Limpeza” do BDVariável Número do sujeito:

• Como esta é a variável de identificação dos casos não podemos ter nenhuma freqüência diferente de 1, pois neste caso teríamos dois sujeitos com a mesma identificação.

Número do Sujeito

1 2,8 2,8 2,8

1 2,8 2,8 5,6

1 2,8 2,8 8,3

1 2,8 2,8 11,1

1 2,8 2,8 13,9

1 2,8 2,8 16,7

1 2,8 2,8 19,4

1 2,8 2,8 22,2

1 2,8 2,8 25,0

1 2,8 2,8 27,8

1 2,8 2,8 30,6

1 2,8 2,8 33,3

1 2,8 2,8 36,1

1 2,8 2,8 38,9

1 2,8 2,8 41,7

1 2,8 2,8 44,4

1 2,8 2,8 47,2

1 2,8 2,8 50,0

1 2,8 2,8 52,8

1 2,8 2,8 55,6

1 2,8 2,8 58,3

1 2,8 2,8 61,1

1 2,8 2,8 63,9

1 2,8 2,8 66,7

1 2,8 2,8 69,4

1 2,8 2,8 72,2

1 2,8 2,8 75,0

1 2,8 2,8 77,8

1 2,8 2,8 80,6

1 2,8 2,8 83,3

1 2,8 2,8 86,1

1 2,8 2,8 88,9

1 2,8 2,8 91,7

1 2,8 2,8 94,4

1 2,8 2,8 97,2

1 2,8 2,8 100,0

36 100,0 100,0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

Total

ValidFrequency Percent Valid Percent

CumulativePercent

Como se familiarizar com seu banco de dados

“Limpeza” do BDVariável Estado civil:

Estado civil

16 44,4 44,4 44,4

19 52,8 52,8 97,2

1 2,8 2,8 100,0

36 100,0 100,0

Solteiro

Casado

4

Total

ValidFrequency Percent Valid Percent

CumulativePercent

Aqui encontramos um problema: na distribuição de freqüência aparece um código 4. Temos que identificar qual o caso corrigí-lo.

Como se familiarizar com seu banco de dados

“Limpeza” do BD

Temos várias maneiras de localizar o caso. Uma delas é marcando a coluna da variável onde se encontra o problema e depois clicar em “Find”.

Como se familiarizar com seu banco de dados

“Limpeza” do BD

Digitar aqui o valor “estranho” e depois em “Find Next”.

Como se familiarizar com seu banco de dados

“Limpeza” do BD

Depois de identificado o sujeito...

Como se familiarizar com seu banco de dados

“Limpeza” do BD

... verificar o erro e corrigí-lo.

Como se familiarizar com seu banco de dados

“Limpeza” do BDVariável Grau de instrução:

• Aqui não nenhuma inconsistência.

• Uma das possíveis observações que podemos fazer é: 33,3% de pessoas que concluíram o Ensino Fundamental.

Grau de instrução

12 33,3 33,3 33,3

18 50,0 50,0 83,3

6 16,7 16,7 100,0

36 100,0 100,0

Ensino Fundamental

Ensino Médio

Supeior

Total

ValidFrequency Percent Valid Percent

CumulativePercent

Como se familiarizar com seu banco de dados

“Limpeza” do BDVariável Número de filhos:

• Nesta variável aparece um sujeito com 55 filhos. Devemos novamente localizar o sujeito e verificar se a informação está correta.

Número de filhos

4 11,1 19,0 19,0

5 13,9 23,8 42,9

7 19,4 33,3 76,2

3 8,3 14,3 90,5

1 2,8 4,8 95,2

1 2,8 4,8 100,0

21 58,3 100,0

15 41,7

36 100,0

0

1

2

3

5

55

Total

Valid

SystemMissing

Total

Frequency Percent Valid PercentCumulative

Percent

Como se familiarizar com seu banco de dados

“Limpeza” do BD

Agora vamos ver outra maneira de localizar o caso. Quando o valor procurado for o maior ou o menor de todos, basta marcar a coluna da variável onde se encontra o problema, clicar com o botão direito do mouse e depois clicar em “Sort Descending” ou “Sort Ascending”, dependendo do caso.

Como se familiarizar com seu banco de dados

“Limpeza” do BD

Identificado o sujeito e o erro, devemos corrigir o banco. Neste caso corrija para 5.

Como se familiarizar com seu banco de dados

“Limpeza” do BDVariável Número de salários

mínimos:

• Nesta variável não há inconsistência.

• A partir da tabela podemos ver que 50,0% dos sujeitos ganham no máximo 9,8 salários mínimos.

Número de salários mínimos

1 2,8 2,8 2,8

1 2,8 2,8 5,6

1 2,8 2,8 8,3

1 2,8 2,8 11,1

1 2,8 2,8 13,9

1 2,8 2,8 16,7

1 2,8 2,8 19,4

1 2,8 2,8 22,2

1 2,8 2,8 25,0

1 2,8 2,8 27,8

1 2,8 2,8 30,6

1 2,8 2,8 33,3

1 2,8 2,8 36,1

1 2,8 2,8 38,9

1 2,8 2,8 41,7

1 2,8 2,8 44,4

1 2,8 2,8 47,2

1 2,8 2,8 50,0

1 2,8 2,8 52,8

1 2,8 2,8 55,6

1 2,8 2,8 58,3

1 2,8 2,8 61,1

1 2,8 2,8 63,9

1 2,8 2,8 66,7

1 2,8 2,8 69,4

1 2,8 2,8 72,2

1 2,8 2,8 75,0

1 2,8 2,8 77,8

1 2,8 2,8 80,6

1 2,8 2,8 83,3

1 2,8 2,8 86,1

1 2,8 2,8 88,9

1 2,8 2,8 91,7

1 2,8 2,8 94,4

1 2,8 2,8 97,2

1 2,8 2,8 100,0

36 100,0 100,0

4,00

4,56

5,25

5,73

6,26

6,66

6,86

7,39

7,44

7,59

8,12

8,46

8,74

8,95

9,13

9,35

9,77

9,80

10,53

10,76

11,06

11,59

12,00

12,79

13,23

13,60

13,85

14,69

14,71

15,99

16,22

16,61

17,26

18,75

19,40

23,30

Total

ValidFrequency Percent Valid Percent

CumulativePercent

Como se familiarizar com seu banco de dados

“Limpeza” do BDVariável Idade-anos:

• Há um sujeito com 330. Escolha um dos métodos descritos anteriormente e corrija a idade do sujeito para 33.

Idade - anos

1 2,8 2,8 2,8

1 2,8 2,8 5,6

1 2,8 2,8 8,3

2 5,6 5,6 13,9

1 2,8 2,8 16,7

1 2,8 2,8 19,4

1 2,8 2,8 22,2

2 5,6 5,6 27,8

2 5,6 5,6 33,3

2 5,6 5,6 38,9

1 2,8 2,8 41,7

2 5,6 5,6 47,2

2 5,6 5,6 52,8

2 5,6 5,6 58,3

2 5,6 5,6 63,9

1 2,8 2,8 66,7

1 2,8 2,8 69,4

2 5,6 5,6 75,0

2 5,6 5,6 80,6

1 2,8 2,8 83,3

2 5,6 5,6 88,9

1 2,8 2,8 91,7

1 2,8 2,8 94,4

1 2,8 2,8 97,2

1 2,8 2,8 100,0

36 100,0 100,0

20

23

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

46

48

330

Total

ValidFrequency Percent Valid Percent

CumulativePercent

Como se familiarizar com seu banco de dados

“Limpeza” do BDVariável Idade-meses:

• Não há inconsistência.Idade - meses

4 11,1 11,1 11,1

1 2,8 2,8 13,9

3 8,3 8,3 22,2

1 2,8 2,8 25,0

3 8,3 8,3 33,3

5 13,9 13,9 47,2

3 8,3 8,3 55,6

6 16,7 16,7 72,2

3 8,3 8,3 80,6

1 2,8 2,8 83,3

4 11,1 11,1 94,4

2 5,6 5,6 100,0

36 100,0 100,0

0

1

2

3

4

5

6

7

8

9

10

11

Total

ValidFrequency Percent Valid Percent

CumulativePercent

Como se familiarizar com seu banco de dados

“Limpeza” do BDVariável Região onde mora:

• Há um código 8, identificar o sujeito e corrigir para 9.

Região onde mora

12 33,3 52,2 52,2

10 27,8 43,5 95,7

1 2,8 4,3 100,0

23 63,9 100,0

13 36,1

36 100,0

capital

interior

8

Total

Valid

9Missing

Total

Frequency Percent Valid PercentCumulative

Percent

Como se familiarizar com seu banco de dados

FIM

Agora este banco está pronto para ser analisado!!!