Introdução ao Stata 11 Universidade Federal de Viçosa
Acompanhe o vídeo prático em http://www.youtube.com/watch?v=BQKjRo-Juts Os dados estão disponível em http://www.4shared.com/dir/yvKiC3J2/Dados.html
Conteúdo
• Noções Gerais do Programa Stata 11.1;
• Iniciando ...
• Trabalhando - importando os dados, etc;
• Criando Gráficos;
• Estatísticas Descritivas;
• Regressão Simples e Múltipla
• Janela
xxxxxxxxxx
xxxxxxxxxx xxxxxxxx
xx
Digite os comandos aqui
Nessa área aparecem as variáveis do banco de dados usado
Nessa área é listado os comandos executados
Nessa área são visualizados os resultados para as as ações executadas
Noções gerais
• O Stata permite que as ações sejam executadas via menu ou comandos.
• O Stata salva os dados, as variáveis do banco de dados, trabalhados no formato .dta;
• Os resultados gerados e visualizados na janela de resultados podem ser salvos e abertos no Word ou Bloco de notas (em formato .log);
• O Stata permite manipular as variáveis com facilidade por comando simples como somar, subtrair, dividir, transformar em logaritmo, etc.
Iniciando ...
• Antes de iniciar os trabalhos, para que todos os
resultados sejam salvos deve-se ir em “Begin logging Stata output” e após terminar é necessário “Close”
• Os resultados também podem ser salvos no Word apenas selecionado os resultados de interesse, copiando e colando no Word. Irá sem formatação, então vc deve formatar a fonte para Lucida Console, tamanho 8.
Trabalhando ...(importando dados) • Importando os dados ( copiando e colando): • Os dados podem ser inseridos no Stata facilmente por meio do
“Data Editor” ou comando “edit”, que abrem a janela de edição dos dados; ▫ Selecione os dados no Excel (o padrão deve ser internacional, com
separador decimal configurado para “ponto” (.) ▫ Copie os dados, selecionado também o nome da variável ▫ Cole no Stata e selecione "Treat fist row as variable names“ (Stata 11) ▫ Feche a Janela
• Se os dados não forem importados corretamente, feche a janela e digite clear na barra de comandos e faça tudo novamente;
• Se as variáveis ficarem vermelhas na janela de edição dos dados, os dados foram importados incorretamente e interpretados pelo programa como texto e não números.
Trabalhando ... (importando dados) • Importando os dados de arquivo csv.
▫ Salve os dados no Excel no Formato csv (Salvar como / CSV (Separado por vígulas)
▫ ATENÇÃO !!!! A primeira linha deve ter os nomes das variáveis, se tiver mais algumas coisa antes exclua a linha
▫ Para importar File/ Import/ ASCII data created by spreadsheet Vá em Browse... / em “Raw Files” clique e marque csv, selecione
o arquivo no seu computador / ok Em “Delimiter” marque “User-specified delimiter e digite “;” no
campo “Value delimiter e ok
• Pode-se usar o comando “insheet using "C:\Users\... \Tabela 1.2 - Gujati (2006).csv", delimiter(";"); ▫ Vc deve mudar apenas o caminho e o nome do arquivo.
Trabalhando ... (formatando os dados)
• Anteriormente os dados foram apenas importados . Para séries temporais é necessário declarar a periodicidade.
• Para isso deve ser criado as variáveis que descrevem a periodicidade dos dados. ▫ Para dados anuais e com inicio em 1990, por exemplo (os
comandos abaixo devem ser digitados ou copiados na barra de comandos. *Apenas cria a variável com nome timevar com início em 1990
gen timevar = y(1990) + _n-1
*Formata a variável para o período anual
format timevar %ty
*"Seta" a variável timevar como tempo da regressão
tsset timevar
Trabalhando ... (formatando os dados)
• Para dados trimestrais e iniciados no segundo trimestre de 1975, por exemplo: ▫ *Cria uma variável timevar com início no segundo
trimestre de 1986 ▫ gen timevar = q(1986q2) +_n-1 ▫ *Formata a variável para trimestral ▫ format timevar %tq ▫ *"Seta" a variável timevar como tempo da
regressão ▫ tsset timevar
Trabalhando ... (formatando os dados)
• Para dados mensais iniciados no mês 7 de 2005, por exemplo: ▫ *Cria uma variável timevar com início em mês 7
de 2000 ▫ gen timevar = m(2000m7)+_n-1 ▫ *Formata para o periodo mensal ▫ format timevar %tm ▫ *Configura a variável timevar como a
periodicidade da regressão ▫ tsset timevar
Criando gráficos..
• Vá em Graphics / Twoway graphs ....
▫ Selecione Create
▫ Escolha as variáveis e o tipo do gráficos
Estatísticas descritivas
• Apenas uso o comando sum (e o nome das variáveis). Para todas as variáveis não é necessário o nome da cada uma.
• Ou clique em:
▫ Statistics / Summaries, tables, and test / Summary and descriptive statistics / Summary statistics.
Estatísticas descritivas
• Interpretando a saída
▫ Variável -> nome da variável;
▫ Obs -> Número de observações;
▫ Mean -> Média da variável;
▫ Std. Dev. -> Desvio Padrão;
▫ Min -> Valor mínimo da variável;
▫ Max -> Valor máximo da variável.
Regressão
• Pode-se usar o comando “reg” seguido da variável dependente e variáveis independentes;
• ou:
• Statistics / Linear models and related/ Linear regression
Regressão
• Como exemplo será usado o Exemplo 3.1 (GUJARATI, 2006, p.73) e dados da Tabela I.1 (GUJARATI, 2006, p.5).
▫ Dados Anuais: 1982 a 1996 (inclusive);
▫ Y – Despesas de consumo pessoal (DCP);
▫ X – Produto Interno Bruto (PIB);
▫ Será estimado o modelo:
𝑌 𝑖 = 𝛼 + 𝛽𝑋𝑖 + 𝜇𝑖
Regressão
• Interpretando a saída: Source | SS df MS Number of obs = 15 -------------+------------------------------ F( 1, 13) = 8144.59 Model | 3351406.23 1 3351406.23 Prob > F = 0.0000 Residual | 5349.35306 13 411.488697 R-squared = 0.9984 -------------+------------------------------ Adj R-squared = 0.9983 Total | 3356755.58 14 239768.256 Root MSE = 20.285 ------------------------------------------------------------------------------ y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- x | .706408 .0078275 90.25 0.000 .6894978 .7233182 _cons | -184.0779 46.26183 -3.98 0.002 -284.0205 -84.13525 ------------------------------------------------------------------------------
• O coeficiente estimado para a variável x foi de 0,706408, com erro padrão de 0,0078, t estatístico 90,25, p_value 0,00 ( a variável é estatisticamente diferente de zero.
• O R² estimado foi de 99,84%, as variáveis foram significativas conjuntamente pelo teste F (8144,59) a um 1% (p_value, Prob>F = 0,000).
Top Related