Treinamento SPSS (Capítulos 1 E 2)

download Treinamento SPSS (Capítulos 1 E 2)

of 19

Transcript of Treinamento SPSS (Capítulos 1 E 2)

2011

SPSS 18(Treinamento Bsico)

Raymundo Jnior IDESP

MDULO IAssuntos abordados 1) Introduo ao SPSS a. Viso geral do SPSS for Windows

2) Sobre o Banco de Dados a. Como criar seu prprio banco de dados b. Definindo propriedades de variveis categricas (nominais e ordinais) c. Importao de arquivos de dados do tipo Excel 3) Transformao de dados a. Recodificao utilizando o procedimento Visual Binning b. Clculo de datas atravs do procedimento Date and Time Wizard 4) Comandos para Anlise Descritiva a. Opo Reports b. Opo Descriptive Statistics

5) Grficos a. Construo de grficos atravs do Chart builder b. Editando o grfico c. A opo Legacy Dialogs 6) Reduzindo o banco de dados a. Reduzindo o nmero de variveis no banco b. Selecionando o nmero de casos

2|Pgina

I.

INTRODUO AO SPSS O SPSS um software estatstico que permite a utilizao de dados em diversos formatos para

gerar relatrios, calcular estatsticas descritivas, conduzir anlises estatsticas complexas e elaborar grcos. O SPSS considerado um dos melhores softwares estatsticos do mercado, justamente porque participa de grande parte do processo que engloba uma anlise estatstica. O programa encontra-se disponvel em vrias verses e para diversas plataformas (Windows, LINUX, Macintosh). Para este curso, usaremos a verso 18. a. Viso geral do SPSS for Windows Inicialmente, a janela que o SPSS abre para que possamos trabalhar Untitled1 [dataset0] SPSS Data Editor (veja Figura 1). Ao longo do trabalho outras janelas podem ser abertas. Cada janela aberta um arquivo em potencial, ou seja, pode ser armazenado, impresso, copiado para outras janelas, etc. Figura I.1 Aspecto inicial do SPSS

3|Pgina

Menu FILE Figura I.2 Menu File

Permite que voc tenha controle sobre tudo que se refere ao gerenciamento de arquivos, como importao, exportao, impresso, abertura de arquivos e salvamento. O primeiro bloco do menu File destina-se abertura de arquivos, seja ele um banco de dados, uma janela de sadas produzida anteriormente ou uma janela de sintaxe. O SPSS consegue ler diretamente diversos tipos de banco de dados, como o Excel, Dbase, entre outros, e, claro, os arquivos produzidos pelo prprio SPSS nas suas diferentes verses. A opo New abre uma nova janela de dados (Dataset) ou outros tipos de janelas do SPSS (output, sintaxe ou script); a opo Open abre um arquivo diretamente; a opo Open Database serve para voc ler arquivos de vrios bancos de dados diferentes atravs de Open Database Connectivity (ODBC), que um mtodo padro de partilha de dados entre bases de dados e outros programas. Os controladores ODBC utilizam a linguagem SQL (Structured Query Language) padro para aderir aos dados de origens exteriores. O segundo bloco do menu File tem por funo salvar qualquer janela do SPSS. O software ainda permite salvar um banco de dados criado no SPSS em outro formato, assim como no prprio formato SPSS. No terceiro bloco do menu File, voc pode renomear um Dataset usando a opo Rename Dataset, obter informaes sobre o contedo do seu banco de dados usando a opo Display Data File Information, forar a criao de um arquivo de dados temporrio em Cache Data, parar o processador do SPSS atravs de Stop Processor ou conectar-se a um servidor para executar anlises em banco de dados maiores atravs do Switch Server. No quarto bloco est localizada a opo de impresso (Print) de qualquer janela que esteja ativa; e no quinto bloco temos a lista de arquivos recentemente utilizados e a opo Exit para voc fechar o SPSS.4|Pgina

Menu EDIT Figura I.3 Menu Edit

Traz comandos relacionados edio, que pode ser diferente de acordo com a janela ativa. Se estivermos na janela de dados, Cut e Paste sero usados para cortar e colar, respectivamente, um conjunto de dados de um lugar para outro. Os comandos Find e Go to Case ajudam a encontrar um registro no banco de dados. No ltimo bloco temos o comando Opitions..., onde podemos definir os principais parmetros do SPSS, como o padro para o tipo de varivel (o padro do SPSS Numeric8.2, isto , varivel numrica com 8 dgitos, sendo que os 2 ltimos so casa decimais), ou ainda o tamanho e fonte dos ttulos da janela de sadas entre muitas outras. Menu VIEW Figura I.4 Menu View

5|Pgina

Pelo menu View voc escolhe como sero mostrados os dados na janela Data Editor (usando as opes Fonts..., Grid Lines e Value Labels). Por este menu tambm possvel disponibilizar ou no atravs da opo Status Bar, a barra inferior, chamada de barra de status, que contm mensagens importantes sobre o SPSS, e finalmente, atravs da opo ToolBars.. voc pode customizar a(s) barra(s) de ferramentas, podendo inclusive, criar uma barra totalmente nova. Clicando na opo Variables, voc dirigido janela Variable View, onde pode se quiser escolher que caracterstica da varivel gostaria de mudar, ou ainda qual a ordem de seu interesse, acionando a opo Customize Variable View. Menu DATA Figura I.5 Menu Data

O menu Data traz funes relacionadas manipulao dos dados. Comandos como definio de datas, ordenao do banco de dados, juno de arquivos em formato SPSS, seleo de casos do arquivo de dados para trabalho, ponderao de valores, etc., fazem parte das opes desse menu.

6|Pgina

Menu TRANSFORM Figura I.6 Menu Transform

A etapa de transformao dos dados concentra-se basicamente no menu Transform. Recursos como criao de novas variveis a partir das j existentes, recodificao de valores do banco de dados, e at mesmo interpolao de valores ausentes em uma srie de tempo so algumas das opes desse menu. Menu ANALYZE Figura I.7 Menu Analyze

Rene todos os procedimentos estatsticos disponveis no SPSS. Este o principal menu que sofre alteraes com a incluso de outros mdulos. medida que so includos mdulos opcionais, o

7|Pgina

n de opes (linhas) existentes nesse menu vai aumentando, ou seja, a quantidade de recursos estatsticos vai se tornando cada vez maior. Menu GRAPHS Figura I.8 Menu Graphs

O menu Graphs contm todos os tipos de grficos que o SPSS oferece. Grficos de barra, rea, setorial (pizza), boxplot, histograma e cartas de controle so apenas alguns deles. Eles podem ser obtidos atravs da opo Chart Builder. Menu UTILITIES Figura I.9 Menu Utilities

Utilities um menu que oferece recursos que no so imprescindveis, mas certamente quebram um galho. Um exemplo obter informaes sobre as variveis do seu arquivo clicando na8|Pgina

opo Variables, ou escolher algum script do SPSS para ser executado (script so programas em Visual Basic que permite a automatizao de muitas tarefas no SPSS). Menu ADD-ONS Figura I.10 Menu Add-nos

Fornece uma breve explicao sobre outros produtos, mdulos e servios oferecidos, e direciona voc para um contedo mais completo sobre esses tpicos na pgina da SPSS. Menu WINDOW Figura I.11 Menu Window

Aqui voc pode navegar pelas janelas criadas pelo SPSS, bastando escolher a janela desejada e clicar em seu nome; ou voc pode minimizar o SPSS com todas as suas janelas atravs da opo Minimize All Windows. Atravs do comando Split voc divide a janela de dados em painis para visualizar vrias partes do banco de dados de uma s vez.9|Pgina

Menu HELP Figura I.12 Menu Help

O ltimo menu o Help. A ajuda no SPSS um dos pontos fortes do software, j que ela muito mais do que uma cpia do manual. Quando clicamos em Help, a primeira opo Topics lhe d a chance de escolher entre esclarecimentos do significado de um termo tcnico ou de algum comando e um ndice remissivo. Um tutorial do SPSS est disponvel atravs da opo Tutorial. Com ele voc pode obter informaes bsicas sobre o uso do SPSS. A opo SPSS Home Page abre automaticamente a pgina da SPSS norte-americana na Internet. Na opo Command Syntax Reference voc ter todos os manuais de sintaxe do SPSS. J a opo Statistic Coach funciona como um tcnico estatstico. Ele ir fazer a voc algumas perguntas sobre os seus dados e o tipo de anlise que voc gostaria de obter, e ento, baseado nas suas respostas, ele lhe indicar o procedimento do SPSS mais apropriado para o seu caso.

10 | P g i n a

II.

SOBRE O BANCO DE DADOS a. Como criar seu prprio banco de dados Antes de comear a entrar valores na janela de dados, preciso atentar ao fato de que o SPSS

tem por regra geral trabalhar com as variveis (campos) definidas em colunas e casos (registros) definidos em linhas. Inicialmente iremos armazenar informaes de uma pesquisa realizada pela FUNCAP, baseada no Formulrio do Atendimento Scio-educativo, aplicado a adolescentes infratores no Estado do Par. Para definir uma varivel, clique duas vezes no nome da varivel no topo da coluna ou na parte inferior da janela de dados clique em Variable View. Dessa maneira o modo de definio de variveis ser exibido na janela de dados. Nesse modo, temos a opo de definir todas as caractersticas que fazem parte de uma varivel: nome, tipo, rtulos, valores ausentes, formato da coluna, o nvel de medida e se a varivel ou no independente (este ltimo o caso da coluna Role, mas no ser vista neste curso) (ver Figura II.1). Figura II.1 Modo de definio de variveis

11 | P g i n a

Figura II.2 Definio de variveis: Nome

Para alternarmos o tipo de varivel, basta clicar em Type, onde podemos definir a varivel como numrica (numeric), moeda (dollar), data (date), alfanumrica (string), entre outros tipos. Usaremos no nosso caso uma codificao para a varivel unidade, onde o nmero 1 corresponde unidade SL ICOARACY, 2 unidade CESEF, 3 unidade SL SANTARM, 4 unidade CIAB e 5 unidade CJM. Portanto, a varivel unidade ser definida como numrica (Figura II.3). Ainda nesta janela voc pode especificar quantos caracteres a varivel ocupa (Width) e o nmero de casas decimais (Decimals Places). Figura II.3 Definio de variveis: Tipo, Tamanho e Casas Decimais

Obs: Voc pode estar se perguntando: porque no definir a varivel cidade como alfanumrica (string) e digitar o nome das unidades, ao invs de nmeros? A resposta simples; muitos dos procedimentos estatsticos no conseguem trabalhar com variveis desse tipo (string), diminui-se o tempo e a

12 | P g i n a

ocorrncia de erros na digitao e tambm porque economizamos espao e conseqentemente tempo no processo dos casos. Um recurso muito til no SPSS a possibilidade de relacionarmos um texto (rtulo) ao nome das variveis. Basta selecionar a coluna Label e digitar o texto desejado. Vamos colocar Unidade de origem como rtulo da varivel unidade. Podemos tambm definir rtulos para os valores que uma determinada varivel pode assumir. A coluna Values reservada para este tipo de definio. Ao clicar neste boto, o SPSS abre uma janela (ver Figura II.4) onde podemos digitar o valor que a varivel assume (Value) e o rtulo para aquele valor (Label). Feito isso, basta clicar em Add para armazenar o rtulo do primeiro valor e passar para a segunda definio. Figura II.4 Definio de variveis: Rtulos para os valores

O SPSS coloca o separador decimal (. ou ,) nas clulas onde no existem informao, e interpreta todos os pontos (ou vrgulas) como valores ausentes (missing). Esses valores no sero considerados como valor vlido. Podemos, porm, querer definir valores especficos como missing. Neste caso, basta selecionar a coluna Missing, clicar no boto que aparecer e escolher a opo mais conveniente (ver Figura II.5). Se escolhermos a opo Discrete missing values, podemos definir o nmero 999 (apena como exemplo, pode ser qualquer outro) como missing, e cada vez que o SPSS encontrar o nmero 999 no meio de uma anlise estatstica que envolve esta varivel ele saber que aquele valor se refere a um valor ausente. Para que o SPSS entenda que clulas em branco no so valor vlidos, basta deixar uma das caselas em branco. Automaticamente o SPSS entender como valor missing qualquer resposta em branco.

13 | P g i n a

Figura II.5 Definio de variveis: Missing values

Obs: Range plus... cria intervalos para valores missing. Ex: uma situao em que de um limite (Low) a outro (High), todos os valores so missing. Em Columns, voc determina a largura da coluna e em Align o alinhamento do texto. E por fim, na coluna Measure, devemos escolher o nvel de medida da varivel. As possveis escolhas so: Escalar (Scale): use essa opo quando os dados so valores numricos numa escala intervalar ou de razo (ex: idade, renda, peso, altura). A varivel dever ser numrica. Ordinal: quando os dados representam categorias com uma ordem intrnseca (ex: pequeno, mdio, grande; concordo totalmente, concordo, discordo, discordo totalmente). Podem ser variveis alfanumricas (string) ou numricas com valores representando as categorias distintas (ex: 1=pequeno, 2=mdio, 3=grande). Nominal: quando os dados representam categorias sem uma ordem intrnseca (ex: estado civil, ocupao, sexo, nacionalidade). Podem ser variveis alfanumricas (string) ou numricas com valores representando as categorias distintas (ex: 1=masculino, 2=feminino). No nosso caso, escolhemos a opo Nominal (no existe ordem nas categorias de unidade). Figura II.6 Definio de variveis

14 | P g i n a

Agora s voltar para o modo de exibio dos dados e digitar os valores coletados, lembrando que cada caso (registro) deve ser digitado em uma linha (ver figura II.7). Figura II.7 Janela de dados aps definio de uma varivel

Para ativar os nomes, basta clicar no cone Value Labels. A Figura II.8 mostra a janela de dados agora com os rtulos ativos. Para desativ-los, basta clicar novamente no mesmo cone. Figura II.8 Janela de dados aps a ativao dos rtulos

b. Definindo propriedades de variveis categricas (nominais e ordinais) No menu Data, temos a opo Define Variables Properties que facilitar a definio dos rtulos dos valores e outras propriedades das variveis categricas. Este comando faz a leitura dos valores atuais dos dados e lista todos os nicos valores para cada varivel selecionada; identifica

15 | P g i n a

valores que esto sem rtulos e promove uma rotulao automtica e ainda pode copiar os rtulos dos valores de uma varivel para uma ou mais variveis selecionadas. Selecione Data Define Variables Properties. Na janela que se abrir (ver Figura II.9), devemos selecionar as variveis que queremos definir algum rtulo e/ou outras propriedades. Clique em Continue. No prximo passo teremos todas as variveis que foram lidas e suas respectivas propriedades (ver Figura II.10) Figura II.9 Janela para a escolha das variveis que sero lidas

16 | P g i n a

Figura II.10 Janela para definir as propriedades das variveis

Na opo Value Label Grid, podemos adicionar novos valores e rtulos ou alterar os j existentes, visualizar a freqncia de cada valore definir qual valor ser missing. Qualquer valor que sofra alguma alterao nessa janela ficar marcado como Changed. Podemos aplicar as mesmas definies da varivel que foi modificada para as outras variveis listadas. Basta clicar na opo To Other Variables e em seguida, na janela Apply Labels and Level to (ver Figura II.11) selecione as variveis que quiser e clique em Copy. Figura II.10 Janela para definir as propriedades das variveis

17 | P g i n a

c. Importao de arquivos de dados do tipo Excel O SPSS pode importar banco de dados gerados em outros formatos, como o Lotus 123, Dbase, Excel, entre outros. Para ter acesso aos diferentes formatos de banco de dados, basta seguir a rotina File.. Open.. Data. A importao de arquivos de dados do Excel para o SPSS requer alguns cuidados na preparao da planilha no Excel, pois o SPSS s consegue ler o nome das variveis e os valores das mesmas. Os ttulos, comentrios, grficos ou frmulas presentes no arquivo no podem ser importados. A Figura II.11 mostra um arquivo do Excel referente a algumas variveis pertinentes identificao de menores infratores, realizada pela FUNCAP, em 2009. Figura II.11 Arquivo no Excel

Podemos notar que o banco de dados contm no apenas as variveis, mas tambm ttulos, linhas em branco e o nome das variveis. Neste caso, ou apagamos tudo aquilo que no vai ser importado pelo SPSS (recomendado), ou anotamos as coordenadas do canto superior esquerdo (A4) e inferir direito (G57) da matriz onde os nomes das variveis e os dados esto efetivamente situados. Para importar esse arquivo de dados, siga a rotina File.. Open.. Data.. (ver Figura II.12).

18 | P g i n a

Figura II.12 Janela para importao do arquivo no Excel

Devemos indicar o disco e o subdiretrio, alm do tipo do arquivo, que no nosso caso Excel (*.xls). Ao clicar em Abrir, aparecer a janela Open Excel Data Source (ver Figura II.13). Em Worksheet, devemos especificar a planilha a ser lida (no nosso caso ser a primeira; Identificao). Alm disso, como o arquivo original contm o nome das variveis, devemos selecionar a opo Read variable names from the first row of data e no quadro Range devemos especificar o intervalo de interesse (se for o caso; A4:G57). Pressione Ok. Figura II.13 Abertura de arquivos em formato Excel

EXERCCIOS (Lista 1)

19 | P g i n a