PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICIPAL NO … · 1 PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO...
Transcript of PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICIPAL NO … · 1 PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO...
1
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO
FEA - Faculdade de Economia e Administração
Programa de Estudos Pós-Graduados em Administração
PESQUISA SOCIO-ECONOMICA AO NIVEL MUNICIPAL NO BRASIL focando principalmente indicadores relacionados a habitação, educação, trabalho e muito particularmente os referentes a GESTÃO FISCAL
MÉTODOS QUANTITATIVOS DA PESQUISA EMPÍRICA
Professor Dr. Arnoldo Jose de Hoyos
Maurício Roberto Ortiz de Camargo
2
LISTA DE GRÁFICOS
Gráfico 1 - Distribuição das Unidades Federativas em Regiões .............................................. 13
Gráfico 2 - Distirbuição das Cidades por Região ..................................................................... 14
Gráfico 3 - Distribuição das Cidades por UF (Ordem Alfabética) ........................................... 15
Gráfico 4 - Distribuição das Cidades por UF (Ordem Crescente) ............................................ 16
Gráfico 5 – Gráficos de dispersão Liq; Inv; Pes; ReP; R1i; T1_2i vs IFGF ............................ 32
Gráfico 6 - Gráficos de dispersão ReP; T1_2i; R1i; Edu; E2_4i; IFGF vs (EeR) Emprego e
Renda ........................................................................................................................................ 33
Gráfico 7 - Gráficos de dispersão E2_4i; R1i; T1_2i; H6i; ReP; IFGF vs Edu (Educação) .... 34
Gráfico 8 - Dendrograma das 13 variáveis ............................................................................... 38
Gráfico 9 – Boxplot de IFGF por Região ................................................................................. 46
Gráfico 10 - Boxplot de Receita Própria por Região ................................................................ 48
Gráfico 11 - Boxplot de Gastos com Pessoal por Região......................................................... 49
Gráfico 12 - Boxplot de Investimeto por Região ..................................................................... 50
Gráfico 13 - Boxplot de Liquidez por Região .......................................................................... 52
Gráfico 14 - Boxplot de Custo da Divida por Região .............................................................. 53
Gráfico 15 - Boxplot de Emprego e Renda por Região ............................................................ 54
Gráfico 16 - Boxplot de Educação por Região ......................................................................... 55
Gráfico 17 - Boxplot de H6 por Região ................................................................................... 56
Gráfico 18 - Boxplot de R1 por Região .................................................................................... 57
Gráfico 19 - Boxplot de T1_2 por Região ................................................................................ 58
Gráfico 20 - Boxplot de S1_1 por Região ................................................................................ 59
Gráfico 21 - Boxplot de E2_4 por Região ................................................................................ 60
Gráfico 22 - Dendrograma das Variáveis Quantitativas ........................................................... 67
Gráfico 23 - Scree Plot das Variáveis Quatitativas .................................................................. 68
Gráfico 24 - Loading Plot das Váriáveis Quantitativas ............................................................ 68
Gráfico 25 - 3D Scatterplot CP1 vs CP2 vs CP3 (6 ≠s ângulos) .............................................. 69
Gráfico 26 - Dendograma similaridade das Médias das UFs ................................................... 71
Gráfico 27 - Dendrograma dos Índices de Variabilidade das UFs. .......................................... 74
Gráfico 28 - Symetric Plot [todas as variáveis quantitativas do projeto] ................................. 87
Gráfico 29 - Symetric Plot [todas as variáveis quantitativas do projeto - R1] ......................... 89
Gráfico 30 - Árvore Classificatória - Regiões do Brasil .......................................................... 92
Gráfico 31 - Árvore Classificatória - 2Brasis agrupados pela similaridade das médias .......... 94
Gráfico 32 - Árvore Classificatória - 2Brasis agrupados por similaridade de "variabilidade" 96
3
LISTA DE FIGURAS
Figura 1 - Resumo do IFGF ...................................................................................................... 17
Figura 2 - Resumo do indicador Receita Própria ..................................................................... 18
Figura 3 - Resumo do indicador Gastos com Pessoal .............................................................. 20
Figura 4 - Resumo do indicador Investimentos ........................................................................ 21
Figura 5 - Resumo do indicador Liquidez ................................................................................ 22
Figura 6 - Resumo do indicador Custo da Dívida .................................................................... 23
Figura 7 - Resumo do indicador Emprego e Renda.................................................................. 25
Figura 8 - Resumo do indicador Educação ............................................................................... 26
Figura 9 - Resumo do indicador H6 ......................................................................................... 27
Figura 10 - Resumo do indicador R1 ....................................................................................... 28
Figura 11 - Resumo do indicador T1_2 .................................................................................... 29
Figura 12 - Resumo do indicador S1_1 .................................................................................... 30
Figura 13 - Resumo do indicador E2_4 .................................................................................... 31
Figura 14 - Quadro resumo das comparações das variáveis quantitativas ............................... 61
Figura 15 - Analise de variância entre IFGF, IFGF100 e IFGF50 ........................................... 62
Figura 16 - - Analise de variância entre EeR, EeR100 e EeR50. ............................................. 62
Figura 17 - - Analise de variância entre Edu, Edu100 e Edu50 ............................................... 62
Figura 18 - Quadro resumo comparativo do universo e das amostras 100 e 50 indivíduos -
IFGF ......................................................................................................................................... 63
Figura 19 - Quadro resumo comparativo do universo e das amostras 100 e 50 indivíduos -
Emprego e Renda [EeR] ........................................................................................................... 64
Figura 20- Quadro resumo comparativo do universo e das amostras 100 e 50 indivíduos -
Educação [Edu]......................................................................................................................... 65
Figura 21 - Mapa 2Brasis agrupados pela similaridade das médias ......................................... 72
Figura 22 - Mapa 2Brasis agrupamento por similaridade dos índices de variabilidade. .......... 75
4
SUMÁRIO
INTRODUÇÃO .......................................................................................................................... 8
ANALISE EXPLORATORIO DE DADOS .............................................................................. 9
1 PREPARAÇÃO DOS DADOS ....................................................................................... 9
1.1 Estatística Descritiva - dados originais .................................................................... 9
1.2 Estatística Descritiva dos dados originais (N*=0) ................................................... 9
1.3 Estatística Descritiva dos dados (adequação dos indicadores à escala 1-0) ........... 10
2 ENTENDENDO OS DADOS ....................................................................................... 11
2.1 Os Indivíduos ......................................................................................................... 11
2.2 As Variáveis ........................................................................................................... 11
3 ANÁLISE DAS VARIÁVEIS ...................................................................................... 13
3.1 Variáveis Categóricas ............................................................................................. 13
3.1.1 Variável: “UF” e “UF2” .............................................................................................. 13
3.2 Variáveis Quantitativas .......................................................................................... 17
3.2.1 Variável: “IFGF” ......................................................................................................... 17
3.2.2 Variável: “Receita Própria” ........................................................................................ 18
3.2.3 Variável: “Gastos com Pessoal” ................................................................................. 19
3.2.4 Variável: “Investimentos” ......................................................................................... 21
3.2.5 Variável: “Liquidez” ................................................................................................... 22
3.2.6 Variável: “Custo da Divida” ....................................................................................... 23
3.2.7 Variável: “Emprego e Renda” .................................................................................... 24
3.2.8 Variável: “Educação” ................................................................................................. 25
3.2.9 Variável: “H6” ............................................................................................................ 26
3.2.10 Variável: “R1” ............................................................................................................ 27
3.2.11 Variável: “T1_2” ........................................................................................................ 28
3.2.12 Variável: “S1_1”......................................................................................................... 29
3.2.13 Variável: “E2_4” ........................................................................................................ 30
RELAÇÃO ENTRE VARIÁVEIS ........................................................................................... 32
5
4 RELAÇÃO ENTRE VARIÁVEIS: CORRELAÇÃO, REGRESSÃO E TESTE QUI-
QUADRADO ....................................................................................................................... 32
4.1 Gráficos de dispersão com LINHAS DE TENDÊNCIAS ..................................... 32
4.1.1 Scatterplot of Liq; Inv; Pes; ReP; R1i; T1_2i vs IFGF .................................................. 32
4.1.2 Scatterplot of ReP; T1_2i; R1i; Edu; E2_4i; IFGF vs (EeR) Emprego e Renda ............ 33
4.1.3 Scatterplot of E2_4i; R1i; T1_2i; H6i; ReP; IFGF vs Edu (Educação) .......................... 34
4.2 Correlação Linear ................................................................................................... 34
4.2.1 Correlations: IFGF; ReP; Pes; Inv; Liq; CD; EeR; Edu;... .............................................. 35
4.3 Regressão dos mínimos quadrados ........................................................................ 35
4.3.1 Regression Analysis: IFGF versus LIQ......................................................................... 36
4.3.2 Regression Analysis: EeR versus ReP ......................................................................... 36
4.3.3 Regression Analysis: Edu versus E2_4i ...................................................................... 37
4.4 Dendrograma .......................................................................................................... 38
4.4.1 Cluster Analysis of Variables: IFGF; ReP; Pes; Inv; Liq; CD; EeR; Edu; ... ................... 38
ANÁLISE DE REGRESSÃO E STEPWISE ........................................................................... 39
5 REGRESSÕES MULTIPLAS ....................................................................................... 39
5.1 Regressão Stepwise ................................................................................................ 39
5.1.1 Stepwise Regression: IFGF versus Liq; Inv; ... ............................................................ 39
5.1.2 Stepwise Regression: EeR versus IFGF; ReP; ... ......................................................... 40
5.1.3 Stepwise Regression: Edu versus IFGF; ReP; ... ......................................................... 41
5.2 Regressão Múltiplas ............................................................................................... 42
5.2.1 Regression Analysis: IFGF versus Liq; Inv; ... ............................................................. 42
5.2.2 Regression Analysis: IFGF versus Liq; Inv; Pes; ReP ................................................... 42
5.2.3 Regression Analysis: EDUCAÇÀO e RENDA (EeR) versus ReP; T1_2i; R1i; Edu; E2_4i; IFGF 43
5.2.4 Regression Analysis: EDUCAÇÀO e RENDA versus ReP; T1_2i .................................. 44
5.2.5 Regression Analysis: EDUCAÇÃO versus E2_4i; R1i; T1_2i; H6i; ReP; IFGF; EeR ....... 44
5.2.6 Regression Analysis: Edu versus E2_4i; R1i ............................................................... 45
COMPARAÇÕES .................................................................................................................... 46
6 COMPARAÇÕES - ANOVA ....................................................................................... 46
6.1 Variável IFGF por Região ...................................................................................... 46
6
6.2 Variável Receita Própria por Região ...................................................................... 48
6.3 Variável Pessoal (Gastos com Pessoal) por Região ............................................... 49
6.4 Variável Investimentos por Região ........................................................................ 50
6.5 Variável Liquidez, por Região ............................................................................... 51
6.6 Variável Custo da Divida ....................................................................................... 53
6.7 Variável Emprego e Renda .................................................................................... 54
6.8 Variável Educação.................................................................................................. 55
6.9 Variável H6 ............................................................................................................ 56
6.10 Variável R1 ......................................................................................................... 57
6.11 Variável T1-2 ...................................................................................................... 58
6.12 Variável S1_1 ..................................................................................................... 59
6.13 Variável E2-4 ...................................................................................................... 60
6.14 Resumo das variáveis ......................................................................................... 61
7 AMOSTRAGEM ........................................................................................................... 62
7.1 Quadro Resumo: Amostragem IFGF ..................................................................... 63
7.2 Quadro Resumo: Amostragem Emprego e Renda ................................................. 64
7.3 Qaudro Resumo: Amostragem Educação .............................................................. 65
ANÁLISE MULTIVARIADA – COMPONENTES PRINCIPAIS ......................................... 66
8 ANÁLISE MULTIVARIADA – COMPONENTES PRINCIPAIS .............................. 66
8.1 Dendograma ........................................................................................................... 66
8.1.1 Cluster Analysis of Variables: IFGF; ReP; Pes; Inv; Liq; CD; EeR; Edu; ... ................... 66
8.2 Componentes Principais ......................................................................................... 67
8.2.1 3D Scatterplot ........................................................................................................... 69
ANÁLISE DE CONGLOMERADOS ..................................................................................... 70
9 ANÁLISE DE CONGLOMERADOS (DENDROGRAMA e ANOVA) ..................... 70
9.1 Dendrograma das médias por UF (-DF) ................................................................. 70
9.2 Dendrograma dos índices de variabilidade por UF (-DF) ...................................... 73
9.3 Análise das variâncias dos agrupamentos das UFs ................................................ 76
7
9.3.1 Região - IFGF .............................................................................................................. 76
9.3.2 UFs - IFGF ................................................................................................................... 76
9.3.3 Região - Emprego e Renda ........................................................................................ 77
9.3.4 UFs – Emprego e Renda ............................................................................................ 77
9.3.5 Região - Educação ..................................................................................................... 78
9.3.6 UFs - Educação .......................................................................................................... 78
9.3.7 Resumo dos Boxplot .................................................................................................. 80
ANÁLISE DISCRIMINANTE LINEAR ................................................................................. 81
10 ANÁLISE DISCRIMINANTE LINEAR POR REGIÃO ......................................... 81
10.1 Cinco Regiões Brasileiras – Mapa Político ........................................................ 81
10.2 2 Brasis – similaridade nas médias ..................................................................... 81
10.3 2 Brasis – similaridade nos índices de “variabilidade” ...................................... 82
REGRESSÃO LOGISTICA ..................................................................................................... 83
11 REGRESSÃO LOGISTICA ...................................................................................... 83
11.1 Regressão – REGIÃO ......................................................................................... 83
11.2 Regressão Logística – 2 Brasis – similaridade pelas médias ............................. 85
11.3 Regressão Logística – 2 Brasis – similaridade pelos índices de “variabilidade”85
ANÁLISE DE CORRESPONDÊNCIA ................................................................................... 86
12 ANÁLISE DE CORRESPONDÊNCIA DOS ÍNDICES DE GESTÃO FISCAL E
DE DESENVOLVIMENTO ................................................................................................ 86
ÁRVORE DE CLASSIFICAÇÃO ........................................................................................... 91
13 ÁRVORE CLASSIFICATÓRIA ............................................................................... 91
13.1 Árvore de decisão. - Região_1 IFGF_1, ReP_1, Pes_1, Inv_1, Liq_1, CD_1,
EeR_1, Edu_1, H6i_1, R1i_1, T1_2i_1, S1_1i_1, E2_4i_1 ............................................. 92
13.2 Árvore de decisão.- BrasisM_1 pelas variáveis: IFGF_1, ReP_1, Pes_1, Inv_1,
Liq_1, CD_1, EeR_1, Edu_1, H6i_1, R1i_1, T1_2i_1, S1_1i_1, E2_4i_1. .................... 94
13.3 Árvore de decisão.- BrasisV_1 pelas variáveis: IFGF_3, ReP_3, Pes_3, Inv_3,
Liq_3, CD_3, EeR_3, Edu_3, H6i_3, R1i_3, T1_2i_3, S1_1i_3, E2_4i_3. .................... 96
REFERÊNCIAS ....................................................................................................................... 97
8
INTRODUÇÃO
O presente trabalho tem por objetivo efetuar diversas análises dos dados da Pesquisa
Firjan/FGV sobre o Desenvolvimento dos Municípios nos períodos de 2000 e 2010. Iniciamos
com o entendimento dos dados, incluindo a definição dos indivíduos e das variáveis, suas
classificações em variáveis categóricas ou quantitativas, os significados e unidades de medida,
além da apresentação da tabela de dados.
Na seqüência, analisamos cada uma das variáveis separadamente quanto a sua forma de
distribuição, os valores atípicos, medidas de centro e dispersão. Para tal contamos com o
auxílio de gráficos (pie chart, barras, histogramas, gráficos de ramos, box-plot, dot-plot e
curvas de densidade) e de medidas numéricas (média, mediana, quartis, desvio-padrão,
variância, intervalo de confiança e teste de normalidade de Anderson-Darling).
Em seguida faremos comparações entre as diversas variáveis analíticas, utilizando técnicas
como relações entre as variáveis, regressões múltiplas, comparações, amostragem dos dados,
análise multivariada, análise de conglomerados, análise discriminante, regressão logística,
análise de correspondência e arvores de classificação.
Não será possível, a partir destes dados, efetuarmos a análise de tendência pois não existem
séries temporais de dados, requisitos para esta técnica.
Os softwares estatísticos utilizados são: o MINITAB 16 e o SPSS Statistic 21..
9
ANALISE EXPLORATORIO DE DADOS
1 PREPARAÇÃO DOS DADOS
Antes da análise dos dados, é necessário avaliar se não existe alguma inconsistência ou falha que possa incorrer em algum erro nas análises futura. Neste caso, como se pode notar no item 1.1, coluna (N*), que indica o número de dados faltantes, em diversas variáveis estão faltando dados, como exemplo: 304 no IFGF e 22 na Emprego e Renda. 1.1 Estatística Descritiva - dados originais
Descriptive Statistics: IFGF; ReP; Pes; Inv; Liq; CD; EmpRen; Educ; ... Variable N N* Mean StDev Minimum Q1 Median Q3 IFGF 5261 304 0,53222 0,15019 0,07781 0,43018 0,54551 0,64571 ReP 5261 304 0,24148 0,19221 0,01092 0,10088 0,18508 0,31945 Pes 5261 304 0,57742 0,20015 0,00000 0,51118 0,59878 0,69061 Inv 5261 304 0,61640 0,28357 0,00928 0,38234 0,60609 0,89366 Liq 5261 304 0,57214 0,37358 0,00000 0,19358 0,69333 0,91435 CD 5260 305 0,80544 0,16029 0,00000 0,72081 0,82897 0,92474 EmpRen 5543 22 0,40414 0,15543 0,00000 0,30631 0,37608 0,47134 Educ 5543 22 0,74156 0,11248 0,37456 0,66324 0,74649 0,82351 H6 5565 0 54,319 13,553 4,735 45,035 55,297 64,616 R1 5565 0 24,525 17,698 0,073 8,618 19,990 39,479 T1_2 5565 0 56,304 18,234 6,400 41,272 57,421 71,384 S1_1 5566 1 14,260 14,281 0,000 4,294 12,579 20,059 E2_4 5565 0 85,481 8,881 45,722 79,528 87,510 92,529 Variable Maximum IFGF 0,97475 ReP 1,00000 Pes 1,00000 Inv 1,00000 Liq 1,00000 CD 1,00000 EmpRen 1,00000 Educ 1,00000 H6 89,335 R1 78,801 T1_2 94,914 S1_1 333,333 E2_4 100,000
1.2 Estatística Descritiva dos dados originais (N*=0)
Como foi observado no tópico anterior que em todos os indicadores de Gestão Fiscal estão faltando (N* - coluna) 304 dados, e nos indicadores “Gerais”, Emprego e Renda e Educação, estão faltando 22 e no de Saúde (S1_1) está faltando apenas 1. Para corrigir este problema, adotou-se usar o número referente ao primeiro pior quartil para as células vazias. Descriptive Statistics: IFGF; ReP; Pes; Inv; Liq; CD; EeR; Edu; ... Variable N N* Mean StDev Minimum Q1 Median Q3
10
IFGF 5565 0 0,52670 0,14790 0,08000 0,43000 0,53000 0,64000 ReP 5565 0 0,23375 0,18961 0,01000 0,10000 0,17000 0,31000 Pes 5565 0 0,57381 0,19519 0,00000 0,51118 0,58835 0,68441 Inv 5565 0 0,60344 0,28091 0,01000 0,38000 0,58000 0,87000 Liq 5565 0 0,55130 0,37352 0,00000 0,19000 0,66000 0,91000 CD 5565 0 0,80080 0,15702 0,00000 0,72081 0,81881 0,91716 EeR 5565 0 0,40379 0,15522 0,00000 0,30648 0,37576 0,47111 Edu 5565 0 0,74125 0,11237 0,37456 0,66324 0,74595 0,82305 H6 5565 0 54,319 13,553 4,735 45,035 55,297 64,616 R1 5565 0 24,525 17,698 0,073 8,618 19,990 39,479 T1_2 5565 0 56,304 18,234 6,400 41,272 57,421 71,384 S1_1 5567 0 14,259 14,280 0,000 4,294 12,579 20,050 E2_4 5565 0 85,481 8,881 45,722 79,528 87,510 92,529 Variable Maximum IFGF 0,97000 ReP 1,00000 Pes 1,00000 Inv 1,00000 Liq 1,00000 CD 1,00000 EeR 1,00000 Edu 1,00000 H6 89,335 R1 78,801 T1_2 94,914 S1_1 333,333 E2_4 100,000
1.3 Estatística Descritiva dos dados (adequação dos indicadores à escala 1-0)
Em seguida, para adequar os dados no estudo e possibilitar avaliações comparativas entre estes, os indicadores: H6, R1, T1_2, S1_1 e E2_4, foram transformados em indicadores que variam de 0 à 1, e para tal adotou-se à seguinte fórmula:
11
Edu 1,00000 H6i 1,00000 R1i 1,00000 T1_2i 1,00000 S1_1i 1,00000 E2_4i 1,00000
2 ENTENDENDO OS DADOS
2.1 Os Indivíduos
Os indivíduos desta base de dados são os municípios brasileiros ano 2010. Trata-se de um
total de 5565 munícipios, distribuídos em 27 unidades federativas, sendo 26 estados e um
distrito federal. Para o desenvolvimento desta pesquisa, não consideraremos as informações
do distrito federal, pois as comparações serão com base nos estados e, não, nas unidades
federativas. Os dados analisados de cada munícipio são as variáveis que descrevemos a
seguir. 2.2 As Variáveis
São 16 as variáveis desta pesquisa, sendo 3 categóricas e 13 variáveis quantitativas. As mesmas são melhor explicadas na Tabela 1. Ressaltamos que todos os dados desta pesquisa são referentes ao ano de 2010.
Variável Significado Tipo Unidade de Medida
UF Abreviação de Unidade Federativa (ou Unidade da Federação) do Brasil. As UF do Brasil são entidades autônomas, com governo e constituição próprias, que em seu conjunto constituem a República Federativa do Brasil. (IBGE, 2013)
Variável Categórica
N/A
Município O município é a divisão administrativa autônoma da UF. São as unidades de menor hierarquia dentro da organização político administrativa do Brasil, criadas através de leis ordinárias das Assembléias Legislativas de cada Unidade da Federação e sancionadas pelo Governador. (IBGE, 2013)
Variável Categórica
N/A
UF2 Apresenta a sigla que representa as Unidades Federativas (ou Unidades da Federação) do Brasil.
Variável Categórica
N/A
IFGF Índice Firjan de Gestão Fiscal. O IFGF é composto por cinco indicadores: Receita Própria, Gastos com Pessoal, Investimentos, Liquidez e Custo da Dívida. Os quatro primeiros possuem peso 22,5% e o último 10,0% no resultado final do Índice. A seguir, a descrição de cada um deles. (FIRJAN, 2013)
Variável Quantitativa
0 - 1 (qto + próx.
de 1 melhor)
12
Receita Própria
é, de acordo com a FIRJAN (2013), “a dependência de transferências intergovernamentais engessa o orçamento dos municípios, uma vez que é pautada por incertezas e está sujeita á programação das administrações superiores. Assim, um município deve ser capaz de gerar um alto nível de receita própria para ter condições de colocar em prática projetos de longo prazo. Este indicador tem o objetivo de verificar o grau de autonomia das receitas do município. A receita própria do município é formada por IPTU, ISS, IRFF e Outras Receitas Próprias".
Variável Quantitativa
0 - 1 (qto + próx.
de 1 melhor)
Pessoal refere-se aos Gastos com Pessoal, ou seja, é "a despesa com pessoal é o principal item da despesa do setor público. Este indicador busca avaliar o comprometimento das receitas com as despesas de pessoal, a formula de cálculo leva em consideração, bases da Lei de Responsabilidade Fiscal – LRF". (FIRJAN, 2013)
Variável Quantitativa
0 - 1 (qto + próx.
de 1 melhor)
Investimentos “o objetivo deste indicador é medir a parcela dos investimentos nos orçamentos municipais. Estabeleceu-se que a nota de corte seria investir 20% da RCL – Receita Corrente Líquida”. (FIRJAN, 2013)
Variável Quantitativa
0 - 1 (qto + próx.
de 1 melhor)
Liquidez "o indicador procura verificar se o município possui recursos financeiros suficientes para fazer frente ao montante de restos a pagar. Se o município apresentar mais restos a pagar do que ativos financeiros disponíveis a pontuação será zero". (FIRJAN, 2013)
Variável Quantitativa
0 - 1 (qto + próx.
de 1 melhor)
Custo da Dívida
"este indicador avalia o peso dos encargos da dívida em relação às receitas líquidas reais, destacando-se que o limite é de 13%". (FIRJAN, 2013)
Variável Quantitativa
0 - 1 (qto + próx.
de 1 melhor)
Emprego e Renda
Geração, estoque e salários médios dos empregos formais (IFDM).
Variável Quantitativa
0 - 1 (qto + próx.
de 1 melhor)
Educação Média ponderada dos indicadores da dimensão Educação (E1_1, E1_2, E2_1, E2_2, E2_3, E2_4, E2_5, E2_6, E3_1, E3_2 e E3_3) padronizada pela média do Brasil.
Variável Quantitativa
0 - 1 (qto + próx.
de 1 melhor)
H6 Percentual de pessoas que vivem em domicílio que tem densidade de moradores por dormitório inferior a 2.
Variável Quantitativa
0 - 1 (qto + próx.
de 1 melhor)
R1 Percentual da população residente com renda domiciliar mensal per capita abaixo de R$ 140, a preços de 2010. Foi utilizado o INPC para encontrar o valor da linha de extrema pobreza em 2000.
Variável Quantitativa
0 - 1 (qto + próx.
de 0 melhor)
T1_2 Taxa de formalização entre os empregados Variável Quantitativa
0 - 1 (qto + próx.
de 1 melhor)
13
S1_1 Taxa de sobrevivência infantil no primeiro ano de vida, representada pela diferença entre o número de nascidos vivos e o número de óbitos até um ano de idade.
Variável Quantitativa
0 - 1 (qto + próx.
de 1 melhor)
E2_4 Percentual de crianças de 7 a 14 anos que estão na série correta segundo a idade
Variável Quantitativa
0 - 1 (qto + próx.
de 1 melhor)
Tabela 1- As Variáveis
3 ANÁLISE DAS VARIÁVEIS
3.1 Variáveis Categóricas
Este tipo de variável indica que o foco de concentração deve ser a análise de gráficos do tipo
pie chart e barras.
3.1.1 Variável: “UF” e “UF2”
Nossa amostra, apurou-se um total de 27 unidades federativas, sendo 25 estados e 01 distrito
federal. As unidades federativas estão distribuídas em 5 regiões, como representada no
Gráfico 1 - Distribuição das Unidades Federativas em Regiões.
3; 11,5%Sul
4; 15,4%Sudeste
7; 26,9%Norte
9; 34,6%Nordeste
3; 11,5%Centro-Oeste
Category
Sul
Centro-OesteNordesteNorteSudeste
Distribuição das Unidades Federativas em Regiões
Gráfico 1 - Distribuição das Unidades Federativas em Regiões
3.1.2 Variável: “Munícipios”
14
Os gráficos abaixo nos ajudam a entender melhor o comportamento desta variável
Centro-OesteNordesteNorteSudesteSul
Category
Sul1191; 21,4%
Sudeste1669; 30,0%
Norte447; 8,0%
Nordeste1790; 32,2%
Centro-Oeste468; 8,4%
Distiribuição das cidades por região - População
Gráfico 2 - Distirbuição das Cidades por Região
No que diz respeito a relação regiões e cidades pode-se observar no Gráfico 2 - Distirbuição
das Cidades por Região - que as regiões Nordeste (32,2%), Sudeste (30,0%) e Sul (21,4%)
concentram 83, 6% dos municípios do território nacional, enquanto as demais regiões, Norte
(8,0%) e Centro-Oeste (8,4%) somam apenas 16, 4% dos munícipios. Além da concentração
dos municípios brasileiros, as três regiões tem em comum o fato de serem as três regiões
banhadas significativamente pelo oceano Atlântico. Fato este, que nos ajuda a entender a
concentração nestas regiões.
15
.
TO
SP
SE
SC
RS
RRRO
RN
RJ
PR
PIPE PB
PAMT
MS
MG
MA
GO
ESDF
CE
BA
APAMALAC
C ategory
BAC EDFESGOMAMGMSMTPA
A C
PBPEPIPRRJRNRORRRSSC
A L
SESPTO
A MA P
Distribuição das Cidades por UF
Unidades Federativas (UF2)
Qtd
e de
Cid
ades
TOSPSESCRSRRRORNRJPRPIPEPBPAMTMSMGMAGOESDFCEBAAPAMALAC
900
800
700
600
500
400
300
200
100
0
300
150
450
600
750
UF2
BAC EDFESGOMAMGMSMTPA
A C
PBPEPIPRRJRNRORRRSSC
A L
SESPTO
A MA P
138
647
75
295
497
1552
167
92
399
223185
222
142142
78
852
217247
78
1
184
416
1662
101
22
Distribuição das Cidades por Unidades da Federação(ordem alfabética)
Gráfico 3 - Distribuição das Cidades por UF (Ordem Alfabética)
16
Unidades Federativas (UF2)
Qtd
e de
Cid
ades
MGSPRSBAPRSCGOPIPBMAPECERNPAMTTOALRJMSESSEAMROACAPRRDF
900
800
700
600
500
400
300
200
100
0
300
150
450
600
750
medianaUF2
BAC EDFESGOMAMGMSMTPA
A C
PBPEPIPRRJRNRORRRSSC
A L
SESPTO
A MA P
852
647
497
416399
295247
223222217185184167
142142138101927878756252
2216151
Distribuição das Cidades por Unidades da Federação(ordem crescente)
Gráfico 4 - Distribuição das Cidades por UF (Ordem Crescente)
Com base na análise dos gráficos acima: Gráfico 3 - Distribuição das Cidades por UF (Ordem Alfabética)- e Gráfico 4 - Distribuição das Cidades por UF (Ordem Crescente), podemos tecer alguns comentários em relação ao comportamento da relação de munícipios por unidades federativas:
- A distribuição de municípios por Unidades Federativas (UF) brasileiras são muito desiguais. Como exemplo, o estado de Minas Gerais (852 munícipios) tem 56 (cinquenta e seis) vezes mais munícipios que o estado de Roraima (15 municípios).
- O primeiro quartil das UF está concentrado na região Norte e extremo oeste do país, sendo que das 6 (seis) UF com menor número de municípios, 5 (cinco) fazem parte da região Norte, bioma amazônico brasileiro. Em ordem crescente, as UF com menos munícipios são: Roraima (15), Amapá (16), Acre (22), Roraima (52) e Amazonas (62). Estas 5 (cinco) UF abrangem apenas 3% do total dos munícipios brasileiros.
- No outro extremo, temos 5 (cinco) UF que estão divididas em mais de 300 (trezentos) munícipios, a saber, em ordem decrescente: Minas Gerais (852), São Paulo (647), Rio Grande do Sul (497), Bahia (416) e Paraná (399). Nestes cinco estados (pouco menos de 20% das UF) concentram (2811) mais de 50% dos municípios brasileiros.
- As demais UF (61%) tem entre 75 e 295 munícipios, ou seja, 16 UF compõe 46,5% municípios brasileiros.
17
3.2 Variáveis Quantitativas
A análise deste tipo de variável permite a utilização de uma maior gama de ferramentas de análise como histogramas, curvas de densidade, gráfico de ramos, box-plot e dot-plot, além de informações numéricas como média, desvio-padrão, mediana, quartis, 5 números, intervalo de confiança e teste de normalidade de Anderson-Darling.
3.2.1 Variável: “IFGF”
Segue abaixo Figura 1 - Resumo IFGF – contendo: Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, além das medidas numéricas como média, desvio-padrão, variância, quantidade de observações, valores mínimos, máximos, informações dos quartis e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável IFGF.
0,960,840,720,600,480,360,240,12
Median
Mean
0,5400,5350,5300,525
A nderson-Darling Normality Test
V ariance 0,02188Skewness -0,220837Kurtosis -0,400000N 5565
Minimum 0,08000
A -Squared
1st Q uartile 0,43000Median 0,530003rd Q uartile 0,64000Maximum 0,97000
95% C onfidence Interv al for Mean
0,52281
14,16
0,53058
95% C onfidence Interv al for Median
0,53000 0,54000
95% C onfidence Interv al for StDev
0,14521 0,15070
P-V alue < 0,005
Mean 0,52670StDev 0,14790
95% Confidence Intervals
Summary for IFGF
Figura 1 - Resumo do IFGF
As principais observações que podemos fazer são: - Forma: O Histograma nos permite verificar que trata-se de uma distribuição visivelmente
assimétrica com cauda levemente alongada para a esquerda. Esta conclusão está comprovada pelo teste de normalidade de Anderson-Darling que indica que a distribuição não pode ser considerada uma Normal (p-value < 0,05). A distribuição tem um único pico, decorrente dos ajustes feitos em 0,43 para preencher os municípios sem dados. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta assimetria da distribuição. A posição da linha da mediana afastada do centro do quadrado principal do Box-Plot nos confirma estas afirmativas.
18
- Valores Atípicos: Há 5 valores de IFGF atípicos no gráfico. Trata-se de 3 municípios do
Nordeste com valores muito baixos, Ilha Grande/PI (0,08), Buerarema/BA (0,10) e Conceição/PB (0,11) e dois muito acima Poá/SP (0,96) e Santa Isabel/GO (0,97).
- Centro e Dispersão: A mediana nos indica que aproximadamente metade dos munícipios
têm IFGF menor do que 0,53 e metade IFGF maior do que este valor. O IFGF médio do dos municípios é de 0,5267, e o desvio-padrão (medida de dispersão) é 0,1479. O IFGF mínimo é de 0,08, e o máximo 0,97, demonstrando uma grande amplitude. A mediana é de 0,53, estando muito próxima da média. Com 95% de confiança, podemos afirmar que a média encontra-se entre os valores 0,52281 e 0,53058.
3.2.2 Variável: “Receita Própria”
Segue abaixo Figura 2 - Resumo do indicador Receita Própria – contendo: Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, além das medidas numéricas como média, desvio-padrão, variância, quantidade de observações, valores mínimos, máximos, informações dos quartis e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável Receita Propria.
0,980,840,700,560,420,280,140,00
Median
Mean
0,240,220,200,180,16
A nderson-Darling Normality Test
V ariance 0,03595Skewness 1,67653Kurtosis 3,01314N 5565
Minimum 0,01000
A -Squared
1st Q uartile 0,10000Median 0,170003rd Q uartile 0,31000Maximum 1,00000
95% C onfidence Interv al for Mean
0,22877
263,55
0,23873
95% C onfidence Interv al for Median
0,17000 0,18000
95% C onfidence Interv al for StDev
0,18615 0,19320
P-V alue < 0,005
Mean 0,23375StDev 0,18961
95% Confidence Intervals
Summary for Receita Própria
Figura 2 - Resumo do indicador Receita Própria
As principais observações que podemos fazer são:
19
- Forma: O Histograma nos permite verificar que se trata de uma distribuição visivelmente assimétrica com cauda alongada para a direita, o que é comum para variáveis que indiquem ganhos, receitas, salários, etc. Esta conclusão está comprovada pelo teste de normalidade de Anderson-Darling que indica que a distribuição não pode ser considerada uma normal. Muitos munícipios dependem de despesas voluntárias de outros entes. A distribuição tem um único pico, que representa municípios com Receita Própria entre 0,09 e 0,11. Porém, alguma municípios tem o indicador de Receitas Própria muito altas, o que faz com o gráfico se estenda para a direita. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta assimetria da distribuição. A posição da linha da mediana longe do centro do quadrado principal do Box-Plot nos confirma estas afirmativas.
- Valores Atípicos: Há mais de 40 valores de Receita atípicos no gráfico. Trata-se de munícipios de maiores indicadores de Receita Própria, referentes às regiões Sul e Sudeste que apresentam infraestrutura e níveis de atividades econômicas que justificam tal disparidade.
- Centro e Dispersão: A mediana nos indica que aproximadamente metade das municípios tem indicador de Receita Própria menor do que 0,17 e a outra metade dos indicadores de Receita Própria maior do que este valor. O indicador de Receita Própria médio entre os munícipios brasileiros é 0,23, mas o desvio-padrão (medida de dispersão) é comparativamente bastante elevado 0,1861, maior que a mediana. O indicador de Receita Própria mínima é de 0,01 (menor valor possível), e a máxima de 1,00, demonstrando uma grande amplitude. A mediana é de 0,17, estando longe da média, o que por si só parece demonstrar uma assimetria na distribuição.
3.2.3 Variável: “Gastos com Pessoal”
Segue abaixo Figura 3 - Resumo do indicador Gastos com Pessoal – contendo: Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, além das medidas numéricas como média, desvio-padrão, variância, quantidade de observações, valores mínimos, máximos, informações dos quartis e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável Gastos com Pessoal.
20
0,980,840,700,560,420,280,140,00
Median
Mean
0,6100,6050,6000,5950,5900,5850,580
A nderson-Darling Normality Test
V ariance 0,03854Skewness -1,47306Kurtosis 2,95968N 5565
Minimum 0,00000
A -Squared
1st Q uartile 0,52000Median 0,610003rd Q uartile 0,69000Maximum 1,00000
95% C onfidence Interv al for Mean
0,57841
235,44
0,58873
95% C onfidence Interv al for Median
0,60000 0,61000
95% C onfidence Interv al for StDev
0,19273 0,20003
P-V alue < 0,005
Mean 0,58357StDev 0,19632
95% Confidence Intervals
Summary for Pessoal
Figura 3 - Resumo do indicador Gastos com Pessoal
Com base neste quadro-resumo, concluímos: - Forma: O Histograma nos permite verificar que se trata de uma distribuição assimétrica, o
que é confirmado pelo P-Value muito menor do que 5% no teste de normalidade de Anderson-Darling. Este é um indicador financeiro que relaciona o comprometimento da receita com as despesas de pessoal. A curva de densidade e o P-Value não nos permitem assumir que trata-se de uma distribuição Normal. A distribuição tem dois picos, o primeiro em torno de 0, com 385 municípios, dos quais 276 são munícipios de unidades da federação da região nordeste, e outra em torno de 0,69, terceiro quartil, como resultado do ajuste que foi com os munícipios que não tinham dados. O Box-Plot e a análise dos 5 números, nos confirmam as observações acima. A linha da mediana está no centro da caixa principal do Box-Plot, entre o 1º e 3º, levemente deslocada para a direita.
- Valores Atípicos: Os valores atípicos identificados referentes ao indicador Gastos com Pessoal despontam nas duas extremidades, de um lado, os 385 munícipios com o indicador igual a zero, sendo que destes 276 são munícipios de unidades da federação da região nordeste, e, de outro, os munícipios (59) que tiveram o indicador de Gastos com Pessoal acima de 0,95.
- Centro e Dispersão: A mediana nos indica que aproximadamente metade dos munícipios tem indicador de Gastos com Pessoal menor do que 0,61 e metade apresentam os indicadores Gastos com Pessoal maior do que este valor. O indicador Gasto com Pessoal médio entre os munícipios é 0,5835 e com desvio-padrão (dispersão) de 0,19632. A mediana está relativamente próxima da média, o que por si só pode demonstrar uma maior simetria, entretanto não há intersecção entre os intervalos de confiança das duas. O valor mínimo é de 0,00 e o máximo de 1,00.
21
3.2.4 Variável: “Investimentos”
Segue abaixo Figura 4 - Resumo do indicador Investimentos – contendo: Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, além das medidas numéricas como média, desvio-padrão, variância, quantidade de observações, valores mínimos, máximos, informações dos quartis e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável “Investimentos”.
0,980,840,700,560,420,280,140,00
Median
Mean
0,610,600,590,580,570,56
A nderson-Darling Normality Test
V ariance 0,07891Skewness 0,04022Kurtosis -1,21177N 5565
Minimum 0,01000
A -Squared
1st Q uartile 0,38000Median 0,580003rd Q uartile 0,87000Maximum 1,00000
95% C onfidence Interv al for Mean
0,59606
111,50
0,61082
95% C onfidence Interv al for Median
0,56000 0,59000
95% C onfidence Interv al for StDev
0,27579 0,28623
P-V alue < 0,005
Mean 0,60344StDev 0,28091
95% Confidence Intervals
Summary for Investimentos
Figura 4 - Resumo do indicador Investimentos
- Forma: O Histograma nos permite verificar que se trata de uma distribuição assimétrica, o
que é confirmado pelo P-Value muito menor do que 5% (p-value < 0,005) no teste de normalidade de Anderson-Darling. Este é um indicador financeiro que se propõe a medir a parcela de investimentos nos orçamentos municipais, sendo que, para tal, estabeleceu-se uma nota de corte de 20% da receita corrente líquida. A curva de densidade e o P-Value não nos permitem assumir que se trata de uma distribuição Normal. A distribuição tem dois picos, que um deles em torno de 0,99 à 1,00 com 1043 municípios, distribuídos em todas as regiões, com uma leve concentração no Sul e Sudeste, respectivamente 350 e 302, e outra em torno de 0,38, primeiro quartil, em decorrência do ajuste que foi com os munícipios que não tinham dados (304 munícipios). O Box-Plot e a análise dos 5 números, nos confirmam as observações acima. A linha da mediana está descentralizada na caixa principal do Box-Plot, entre o 1º e 3º, levemente para a esquerda.
- Valores Atípicos: Não foram identificados valores atípicos identificados referentes ao indicador Investimentos.
- Centro e Dispersão: A mediana nos indica que aproximadamente metade dos munícipios tem indicador de Investimentos menor do que 0,58 e metade apresentam os indicadores Investimentos maior do que este valor. O indicador Investimentos médio entre os munícipios é 0,60344 e com desvio-padrão (dispersão) de 0,28091. A mediana está
22
relativamente próxima da média, o que por si só pode demonstrar uma certa simetria, entretanto, não há se quer intersecção entre os intervalos de confiança das duas. O valor mínimo é de 0,01 e o máximo de 1,00.
3.2.5 Variável: “Liquidez”
Segue abaixo Figura 5 - Resumo do indicador Liquidez – contendo: Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, além das medidas numéricas como média, desvio-padrão, variância, quantidade de observações, valores mínimos, máximos, informações dos quartis e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável “Liquidez”.
0,980,840,700,560,420,280,140,00
Median
Mean
0,6750,6500,6250,6000,5750,550
A nderson-Darling Normality Test
V ariance 0,13952Skewness -0,32281Kurtosis -1,46980N 5565
Minimum 0,00000
A -Squared
1st Q uartile 0,19000Median 0,660003rd Q uartile 0,91000Maximum 1,00000
95% C onfidence Interv al for Mean
0,54148
257,90
0,56111
95% C onfidence Interv al for Median
0,63000 0,67000
95% C onfidence Interv al for StDev
0,36671 0,38059
P-V alue < 0,005
Mean 0,55130StDev 0,37352
95% Confidence Intervals
Summary for Liquidez
Figura 5 - Resumo do indicador Liquidez
- Forma: O Histograma nos permite verificar que se trata de uma distribuição assimétrica, o
que é confirmado pelo P-Value muito menor do que 5% (p-value < 0,005) no teste de normalidade de Anderson-Darling. Este é um indicador financeiro que tem por objetivo verificar se o munícipio possui recursos financeiros suficientes para fazer frente ao montante de restos a pagar. Isto posto, primeiro pico apresenta 1029 municípios que estão postergando os pagamentos para o exercícios seguintes sem a devida cobertura, sendo que destes 557, mais da metade, são de unidades federativas da região nordeste. O segundo pico, em torno de 0,19 à 0,21 concentra 334 munícipios, decorrentes do ajuste que foi feito com 304 munícipios que não tinham dados, e assumiu-se os dados do primeiro quartil, 0,19. E, por fim, 531 munícipios tem as suas contas em dia, ou melhor, próximo do que o indicador aponta como ideal, entre 0,99 e 1,00. O Box-Plot e a análise dos 5
23
números, nos confirmam as observações acima. A linha da mediana está descentralizada na caixa principal do Box-Plot, entre o 1º e 3º, levemente para a direita.
- Valores Atípicos: Não foram identificados valores atípicos identificados referentes ao indicador Liquidez.
- Centro e Dispersão: A mediana nos indica que aproximadamente metade dos munícipios tem indicador de Liquidez menor do que 0,66 e metade apresentam os indicadores Liquidez maior do que este valor. O indicador Liquidez médio entre os munícipios é 0,55130 e desvio-padrão (dispersão) de 0,37352. O valor mínimo é de 0,00 e o máximo de 1,00.
3.2.6 Variável: “Custo da Divida”
Segue abaixo Figura 6 - Resumo do indicador Custo da Dívida - contendo: Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, além das medidas numéricas como média, desvio-padrão, variância, quantidade de observações, valores mínimos, máximos, informações dos quartis e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável “Custo da Divida”.
0,980,840,700,560,420,280,140,00
Median
Mean
0,8400,8350,8300,8250,8200,8150,810
A nderson-Darling Normality Test
V ariance 0,02497Skewness -1,28417Kurtosis 2,49243N 5565
Minimum 0,00000
A -Squared
1st Q uartile 0,73000Median 0,840003rd Q uartile 0,92000Maximum 1,00000
95% C onfidence Interv al for Mean
0,80753
101,89
0,81583
95% C onfidence Interv al for Median
0,83000 0,84000
95% C onfidence Interv al for StDev
0,15515 0,16103
P-V alue < 0,005
Mean 0,81168StDev 0,15803
95% Confidence Intervals
Summary for Custo da Dívida
Figura 6 - Resumo do indicador Custo da Dívida
- Forma: O Histograma nos permite verificar que se trata de uma distribuição visivelmente
assimétrica formando uma cauda alongada para a esquerda. Esta conclusão está comprovada pelo teste de normalidade de Anderson-Darling que indica que a distribuição não pode ser considerada uma normal, pois o P-Value é 5%. Este indicador avalia o peso dos encargos financeiros da dívida no que tange às receitas liquidas reais, cujo limite é de 13%. A distribuição tem dois picos, o primeiro é fruto do ajuste feito nos munícipios (304) que estavam sem dados neste indicador e, neste caso, assumiu-se o valor do terceiro
24
quartil. O segundo pico refere-se aos munícipios que estão dentro do que indicador aponta como ideal, acima de 0,99, cujo destaque fica para a região nordeste que possui 309 municipios dentro desta condição. Porém, alguns munícipios têm o indicador de Custo da Dívida muito alt o que faz com o gráfico se concentre para a direita. O Box-Plot e a análise dos 5 números, nos deixam ainda mais clara esta assimetria da distribuição. A posição da linha da mediana levemente deslocada do centro do quadrado principal do Box-Plot nos confirma estas afirmativas.
- Valores Atípicos: Os valores atípicos identificados referentes ao indicador Custo da Dívida despontam na extremidade que apresentam os menores valores, de 0 à 0,44, sendo 153 munícipios com o indicador dentro desta faixa, sendo que destes 58 são munícipios de unidades da federação da região nordeste 56 do Sul.
- Centro e Dispersão: A mediana nos indica que aproximadamente metade dos municípios tem indicador de Custo da Dívida menor do que 0,84 e a outra metade dos indicadores de Custo da Dívida maior do que este valor. O indicador de Custo da Dívida médio entre os munícipios brasileiros é 0,81168, mas o desvio-padrão (medida de dispersão) é 0,15803. O indicador de Custo da Dívida mínima é de 0,00 (menor valor possível), e a máxima de 1,00, demonstrando uma grande amplitude.
3.2.7 Variável: “Emprego e Renda”
Segue abaixo Figura 7 - Resumo do indicador Emprego e Renda - contendo: Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, além das medidas numéricas como média, desvio-padrão, variância, quantidade de observações, valores mínimos, máximos, informações dos quartis e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável “Emprego e Renda”.
As principais observações que podemos fazer são:
- Forma: O Histograma nos permite verificar que se trata de uma distribuição positivamente assimétrica tendendo um alongamento para a direita para a direita, o que é comum para variáveis que indiquem desempenho baixo e menores números dentro de toda a distribuição dos dados. Existe apenas uma corcova no gráfico.
- Valores Atípicos: Há alguns valores atípicos que apresentam resultados muito baixos, concentrando no valor mínimo possível, zero, e muitos valores atípicos acima da curva (0,72208). Esta informação nos diz que existem municípios no Brasil que apresentam taxas de “Emprego e Renda” com valores extremos, acima da curva e alguns abaixo da curva.
- Centro e Dispersão: A mediana nos indica que aproximadamente metade dos municípios tem “Emprego e Renda” menor do que 0,37608, e que o indicador “Emprego e Renda” médio é de 0,40414 e o desvio-padrão (medida de dispersão) é de 0,15543. A amplitude é a maior possível, atingindo os dois extremos da escala, 0 e 1.
25
Figura 7 - Resumo do indicador Emprego e Renda
3.2.8 Variável: “Educação”
Segue abaixo Figura 8 - Resumo do indicador Educação - contendo: Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, além das medidas numéricas como média, desvio-padrão, variância, quantidade de observações, valores mínimos, máximos, informações dos quartis e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável “Educação”.
As principais observações que podemos fazer são:
- Forma: O Histograma nos permite verificar que se trata de uma distribuição que tende a ser simétrica, cujas medidas centrais estão no pico da curva, o que é comum para variáveis que indiquem desempenho regular.
- Valores Atípicos: Há muitos valores atípicos de “Educação”, sendo que estes se concentram no lado inferior da escala.
- Centro e Dispersão: A mediana nos indica que aproximadamente metade dos municípios tem o indicador “Educação” menor do que 0,74595, sendo a média 0,74125 e o desvio-padrão (medida de dispersão) 0,11237, que denota em uma dispersão média para a questão. A amplitude é resultado do mínimo 0,37456 e máximo 1,0000.
26
Figura 8 - Resumo do indicador Educação
3.2.9 Variável: “H6”
Segue abaixo Figura 9 - Resumo do indicador H6 - contendo: Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, além das medidas numéricas como média, desvio-padrão, variância, quantidade de observações, valores mínimos, máximos, informações dos quartis e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável “H6”.
As principais observações que podemos fazer são:
- Forma: O Histograma nos permite verificar que se trata de uma distribuição que tende a ser levemente assimétrica cujo pico concentra-se à direita, o que é comum para variáveis que indiquem desempenho médio para alto. A curva apresenta duas corcovas distintas, o que indica que temos um comportamento atípico da variabilidade sobre os dados de H6
- Valores Atípicos: Há muitos valores atípicos de H6, que se concentram no lado inferior (próximo de zero) da escala.
- Centro e Dispersão: A mediana nos indica que aproximadamente metade dos municípios tem H6 menor do que 0,59765. O H6 médio é de 0,58610 e o desvio-padrão (medida de dispersão) é de 0,16020, que implica em uma dispersão média para H6. A amplitude desta variável é muita alta, atingindo ambos os extremos da escala, zero e um.
27
Figura 9 - Resumo do indicador H6
3.2.10 Variável: “R1”
Segue abaixo Figura 10 - Resumo do indicador R1 - contendo: Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, além das medidas numéricas como média, desvio-padrão, variância, quantidade de observações, valores mínimos, máximos, informações dos quartis e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável “R1”.
As principais observações que podemos fazer são:
- Forma: O Histograma nos permite verificar que se trata de uma distribuição positivamente assimétrica, com um alongamento de cauda a direita, cujo pico concentra-se à esquerda, indicando uma concentração de munícipios com desempenho baixo. A curva apresenta algumas corcovas, sendo duas distintas, a primeira com maior pico e localizada fortemente à esquerda do gráfico e a outra no centro da escala..
- Valores Atípicos: Os dados de R1 não apresentam valores atípicos.
- Centro e Dispersão: A mediana nos indica que aproximadamente metade dos municípios tem R1 menor do que 0,25299, sendo que a média do indicador R1 é de 0,31059 e o desvio-padrão é de 0,22480, valor muito alto, que implica em uma dispersão alta para R1.
28
Figura 10 - Resumo do indicador R1
3.2.11 Variável: “T1_2”
Segue abaixo Figura 11 - Resumo do indicador T1_2 - contendo: Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, além das medidas numéricas como média, desvio-padrão, variância, quantidade de observações, valores mínimos, máximos, informações dos quartis e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável “T1_2”.
As principais observações que podemos fazer são:
- Forma: O Histograma nos permite verificar que se trata de uma distribuição aproximadamente simétrica, embora o gráfico apresente várias corcovas na sua distribuição. Indica que se trata de um desempenho regular. Os municípios apresentam uma regularidade na distribuição de frequência no nível de desenvolvimento. Existem várias corcovas no gráfico que nos mostra que existem realidades distintas nos dados analisados, ou seja, existem vários agrupamentos de tipos de municípios dentro do Brasil em relação a formalização dos empregos.
- Valores Atípicos: Não há valores atípicos de T1_2.
- Centro e Dispersão: A mediana nos indica que metade dos municípios tem o indicador T1_2 menor do que 0,57642, e a outra medida de tendência central, a média, é de 0,56380. Quanto a dispersão, o desvio-padrão é de 0,20600 e a amplitude 1,0000, valor máximo possível neste caso, logo, pode-se dizer que esta variável tem uma dispersão alta.
29
Figura 11 - Resumo do indicador T1_2
3.2.12 Variável: “S1_1”
Segue abaixo Figura 12 - Resumo do indicador S1_1 - contendo: Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, além das medidas numéricas como média, desvio-padrão, variância, quantidade de observações, valores mínimos, máximos, informações dos quartis e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável “S1_1”.
As principais observações que podemos fazer são:
- Forma: O Histograma tem um formato de despenhadeiro e nos permite identificar que se trata de uma distribuição positivamente assimétrica com uma cauda alongada para a direita. A concentração está na parte inferior da escala, ou seja, a maior parte das cidades possui valores baixos do indicador de S1_1, com uma queda abrupta, apresentando uma quantidade muito pequena de cidades que possuem um nível médio de S1_1 e quase nenhuma possuem um nível alto de S1_1.
- Valores Atípicos: Há valores atípicos de S1_1, que apresentam taxas de S1_1 acima da curva.
- Centro e Dispersão: Ambas as medidas de posição estão muito próximas de zero. A mediana nos indica que metade dos municípios tem S1_1 menor do que 0,03774, enquanto a média nos aponta um valor de 0,04278. O desvio-padrão, como medida de dispersão, é de 0,04285, que implica em uma dispersão baixa do índice de S1_1.
30
Figura 12 - Resumo do indicador S1_1
3.2.13 Variável: “E2_4”
Segue abaixo Figura 13 - Resumo do indicador E2_4 - contendo: Histograma, Curva de Densidade, Box-Plot, Intervalo de confiança da média e mediana, além das medidas numéricas como média, desvio-padrão, variância, quantidade de observações, valores mínimos, máximos, informações dos quartis e o teste de normalidade de Anderson-Darling (A-Squared e P-Value), para a variável “E2_4”.
As principais observações que podemos fazer são:
- Forma: o histograma nos permite verificar que se trata de uma distribuição negativamente assimétrica com uma cauda alongada para a esquerda. A curva apresenta diversas corcovas, pelo quais podemos inferir que temos realidades diferentes sobre a questão da série correta dos alunos.
- Valores Atípicos: Os valores atípicos do indicador E2_4 se concentram no lado esquerdo, mais próximos de zero, ou seja, representam municípios cujas crianças não estão na série correta
- Centro e Dispersão: A mediana nos indica que metade dos municípios tem o indicador E2_4 menor do que ou igual a 0,76989, e que a média deste indicador é de 0,73250. No que tange a dispersão, o desvio-padrão é de 0,16363 e a amplitude é alta, 1,0000, que implica em uma dispersão grande para a questão.
31
Figura 13 - Resumo do indicador E2_4
32
RELAÇÃO ENTRE VARIÁVEIS
4 RELAÇÃO ENTRE VARIÁVEIS: CORRELAÇÃO, REGRESSÃO E TESTE QUI-
QUADRADO
4.1 Gráficos de dispersão com LINHAS DE TENDÊNCIAS
A proposta do gráfico de dispersão é que por meio de sua simples observação, em muitos
casos, permite inferir sobre uma possível forma de correlação entre duas variáveis. Neste
estudo analisaremos por meio do gráfico de dispersão a correlação da variável IFGF com
outras seis variáveis (Liquidez; Investimentos; Gastos com Pessoal; Receita Própria; R1 e
T1_2), e o mesmo também com a variável Emprego e Renda (EeR) e outras seis variáveis
(Receita Própria; T1_2; R1; Edu; E2_4 e IFGF), assim como com a variável Educação (Edu)
versus outras 6 variáveis (E2_4; R1; T1_2; H6; Receita Própria e IFGF)
4.1.1 Scatterplot of Liq; Inv; Pes; ReP; R1i; T1_2i vs IFGF
Gráfico 5 – Gráficos de dispersão Liq; Inv; Pes; ReP; R1i; T1_2i vs IFGF
Nos gráficos acima (Gráfico 5) pode-se observar, apesar da grande concentração de pontos
que existe uma correlação entre os indicadores de gestão fiscal (Liq, Inv, Pes, ReP), sendo
todas positivas, ou seja, diretamente proporcional, e o maior o nível de correlação no
indicador Liquidez (Liq). Com T1_2 e R1 além de baixa, no caso de R1 é inversaemente
proporcional.
33
4.1.2 Scatterplot of ReP; T1_2i; R1i; Edu; E2_4i; IFGF vs (EeR) Emprego e Renda
Gráfico 6 - Gráficos de dispersão ReP; T1_2i; R1i; Edu; E2_4i; IFGF vs (EeR) Emprego e Renda
No caso da variável Emprego e Renda observa-se um baixo nível de correlação entre as
variáveis escolhidas para análise, com exceção da variável Receita Própria (ReP), a qual é
diretamente proporcional
34
4.1.3 Scatterplot of E2_4i; R1i; T1_2i; H6i; ReP; IFGF vs Edu (Educação)
Gráfico 7 - Gráficos de dispersão E2_4i; R1i; T1_2i; H6i; ReP; IFGF vs Edu (Educação)
Embora a grande concentração de pontos e pontos atípicos possam dificultar a análise,
percebe-se que com as variáveis E2_4, R1, T1_2 e H6 as correlações tem um nível maior e
apresenta um comportamento positivo, com exceção de R1 que apresenta uma correlação
negativa. As demais, variáveis de Gestão Fiscal, não apresentam ou apresentam um nível
muito baixo de correlação.
4.2 Correlação Linear
A matriz de correlação inclui um valor que varia de zero a um, sendo que quanto mais
próximo de um, maior é o nível de correlação. Os sinais de positivo e negativo,
respectivamente, indicam se a correlação é positiva ou negativa. Foi identificado em amarelo
as correlações entre variáveis que apresentaram uma relação mais significativa. Vale ressaltar
que o índice de correlação entre as variáveis não requer que exista uma relação de causa-
efeito entre ambas.
35
4.2.1 Correlations: IFGF; ReP; Pes; Inv; Liq; CD; EeR; Edu;...
IFGF ReP Pes Inv Liq CD EeR Edu H6i ReP 0,463 0,000 Pes 0,594 0,159 0,000 0,000 Inv 0,602 0,074 0,242 0,000 0,000 0,000 Liq 0,766 0,229 0,266 0,173 0,000 0,000 0,000 0,000 CD 0,184 -0,098 0,069 0,094 0,110 0,000 0,000 0,000 0,000 0,000 EeR 0,330 0,639 0,135 0,037 0,197 -0,066 0,000 0,000 0,000 0,006 0,000 0,000 Edu 0,386 0,403 0,217 0,209 0,234 0,034 0,377 0,000 0,000 0,000 0,000 0,000 0,011 0,000 H6i 0,327 0,214 0,251 0,153 0,260 -0,024 0,211 0,552 0,000 0,000 0,000 0,000 0,000 0,076 0,000 0,000 R1i -0,455 -0,512 -0,268 -0,180 -0,308 0,030 -0,509 -0,753 -0,709 0,000 0,000 0,000 0,000 0,000 0,027 0,000 0,000 0,000 T1_2i 0,429 0,560 0,217 0,126 0,302 -0,048 0,586 0,609 0,449 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 S1_1i -0,066 -0,071 -0,042 -0,024 -0,049 0,011 -0,077 -0,122 -0,115 0,000 0,000 0,002 0,073 0,000 0,412 0,000 0,000 0,000 E2_4i 0,420 0,396 0,274 0,231 0,263 -0,016 0,363 0,765 0,613 0,000 0,000 0,000 0,000 0,000 0,225 0,000 0,000 0,000 R1i T1_2i S1_1i T1_2i -0,782 0,000 S1_1i 0,140 -0,112 0,000 0,000 E2_4i -0,768 0,599 -0,128 0,000 0,000 0,000 Cell Contents: Pearson correlation P-Value
4.3 Regressão dos mínimos quadrados
A correlação mede a direção e a intensidade da relação linear (linha reta) entre duas variáveis
quantitativas. Se um diagrama de dispersão mostra uma relação linear, é interessante
resumirmos esse padrão geral traçando uma reta no diagrama de dispersão. Uma reta de
regressão resume a relação entre duas variáveis, mas somente em um contexto específico:
36
quando uma das variáveis ajuda a explicar ou a predizer a outra, ou seja, a regressão descreve
uma relação entre uma variável explanatória e uma variável resposta.
Neste estudo, apresentaremos a regressão para três pares de variáveis: IFGF e Liquidez (Liq),
Emprego e Renda (EeR) e Receita própria (ReP), e, também, Educação (Edu) e E2_4. Sendo
que a relação analisada é das variáveis: Liquidez (Liq), Receita Própria (ReP) e E2_4,
respectivamente, como explanatórias (independente) de IFGF, Emprego e Renda (EeR) e
Educação (Edu) como variáveis respostas (dependente).
Segue abaixo o resultado da regressão dos três grupos de variáveis e suas respectivas
equações das retas.
4.3.1 Regression Analysis: IFGF versus LIQ
The regression equation is
IFGF = 0,359 + 0,303 LIQ
Predictor Coef SE Coef T P
Constant 0,359464 0,002272 158,19 0,000
LIQ 0,303345 0,003412 88,90 0,000
S = 0,0950751 R-Sq = 58,7% R-Sq(adj) = 58,7%
Analysis of Variance
Source DF SS MS F P
Regression 1 71,431 71,431 7902,34 0,000
Residual Error 5563 50,285 0,009
Total 5564 121,717
4.3.2 Regression Analysis: EeR versus ReP
The regression equation is
EeR = 0,282 + 0,523 ReP Predictor Coef SE Coef T P
37
Constant 0,281523 0,002541 110,78 0,000 ReP 0,523067 0,008443 61,95 0,000 S = 0,119414 R-Sq = 40,8% R-Sq(adj) = 40,8% Analysis of Variance Source DF SS MS F P Regression 1 54,727 54,727 3837,91 0,000 Residual Error 5563 79,327 0,014 Total 5564 134,054
4.3.3 Regression Analysis: Edu versus E2_4i
The regression equation is Edu = 0,356 + 0,526 E2_4i Predictor Coef SE Coef T P Constant 0,356311 0,004448 80,10 0,000 E2_4i 0,525515 0,005927 88,67 0,000 S = 0,0723370 R-Sq = 58,6% R-Sq(adj) = 58,6% Analysis of Variance Source DF SS MS F P Regression 1 41,141 41,141 7862,46 0,000 Residual Error 5563 29,109 0,005 Total 5564 70,251
38
4.4 Dendrograma
Gráfico 8 - Dendrograma das 13 variáveis
4.4.1 Cluster Analysis of Variables: IFGF; ReP; Pes; Inv; Liq; CD; EeR; Edu; ...
Correlation Coefficient Distance, Single Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster 1 12 88,3036 0,233929 1 5 1 2 2 11 88,2635 0,234730 8 13 8 2 3 10 81,9472 0,361056 2 7 2 2 4 9 80,6440 0,387120 8 9 8 3 5 8 80,4258 0,391484 8 11 8 4 6 7 80,0923 0,398153 1 4 1 3 7 6 79,6758 0,406485 1 3 1 4 8 5 79,2961 0,414077 2 8 2 6 9 4 73,1337 0,537326 1 2 1 10 10 3 59,1964 0,816072 1 6 1 11 11 2 57,0157 0,859685 10 12 10 2 12 1 51,4793 0,970413 1 10 1 13
39
ANÁLISE DE REGRESSÃO E STEPWISE
5 REGRESSÕES MULTIPLAS
5.1 Regressão Stepwise
5.1.1 Stepwise Regression: IFGF versus Liq; Inv; ...
Alpha-to-Enter: 0,15 Alpha-to-Remove: 0,15 Response is IFGF on 12 predictors, with N = 5565 Step 1 2 3 4 5 6 Constant 0,35946 0,22404 0,11779 0,09477 0,02972 0,03361 Liq 0,30335 0,27019 0,23988 0,21966 0,21540 0,21605 T-Value 88,90 116,18 145,67 238,95 279,10 276,20 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 Inv 0,2547 0,2194 0,2174 0,2139 0,2142 T-Value 82,36 100,86 182,44 214,54 214,67 P-Value 0,000 0,000 0,000 0,000 0,000 Pes 0,2514 0,2315 0,2286 0,2298 T-Value 78,59 131,49 155,52 154,47 P-Value 0,000 0,000 0,000 0,000 ReP 0,2002 0,2100 0,2110 T-Value 113,92 141,94 141,50 P-Value 0,000 0,000 0,000 CD 0,0861 0,0856 T-Value 49,29 49,08 P-Value 0,000 0,000 H6i -0,0086 T-Value -4,79 P-Value 0,000 S 0,0951 0,0638 0,0439 0,0241 0,0201 0,0200 R-Sq 58,69 81,39 91,18 97,36 98,16 98,17 R-Sq(adj) 58,68 81,38 91,18 97,35 98,16 98,17 Mallows Cp 120097,7 51053,3 21264,3 2489,2 44,9 23,9
40
5.1.2 Stepwise Regression: EeR versus IFGF; ReP; ...
Alpha-to-Enter: 0,15 Alpha-to-Remove: 0,15 Response is EeR on 12 predictors, with N = 5565 Step 1 2 3 4 5 6 Constant 0,2815 0,1759 0,1926 0,3017 0,3163 0,3457 ReP 0,5231 0,3707 0,3688 0,3520 0,3517 0,3527 T-Value 61,95 38,97 38,78 36,19 36,20 36,31 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 T1_2i 0,2505 0,2666 0,2085 0,2079 0,2089 T-Value 28,61 27,87 16,95 16,93 17,01 P-Value 0,000 0,000 0,000 0,000 0,000 H6i -0,043 -0,111 -0,109 -0,103 T-Value -4,14 -8,03 -7,91 -7,37 P-Value 0,000 0,000 0,000 0,000 R1i -0,106 -0,111 -0,128 T-Value -7,45 -7,78 -8,24 P-Value 0,000 0,000 0,000 Inv -0,0229 -0,0207 T-Value -4,26 -3,81 P-Value 0,000 0,000 E2_4i -0,040 T-Value -2,79 P-Value 0,005 S 0,119 0,111 0,111 0,111 0,111 0,111 R-Sq 40,82 48,42 48,58 49,08 49,25 49,32 R-Sq(adj) 40,81 48,40 48,55 49,05 49,20 49,27 Mallows Cp 924,6 94,4 79,0 25,3 9,2 3,4
41
5.1.3 Stepwise Regression: Edu versus IFGF; ReP; ...
Alpha-to-Enter: 0,15 Alpha-to-Remove: 0,15 Response is Edu on 12 predictors, with N = 5565 Step 1 2 3 4 5 6 Constant 0,3563 0,5743 0,5445 0,5196 0,5172 0,5230 E2_4i 0,5255 0,3133 0,3127 0,3128 0,3084 0,3108 T-Value 88,67 36,98 37,05 37,12 36,23 36,42 P-Value 0,000 0,000 0,000 0,000 0,000 0,000 R1i -0,2012 -0,2023 -0,1805 -0,1800 -0,1818 T-Value -32,63 -32,93 -22,94 -22,90 -23,09 P-Value 0,000 0,000 0,000 0,000 0,000 CD 0,0382 0,0392 0,0372 0,0384 T-Value 6,77 6,95 6,58 6,78 P-Value 0,000 0,000 0,000 0,000 T1_2i 0,0305 0,0310 0,0314 T-Value 4,44 4,51 4,58 P-Value 0,000 0,000 0,000 Inv 0,0113 0,0134 T-Value 3,49 4,07 P-Value 0,000 0,000 Pes -0,0165 T-Value -3,43 P-Value 0,001 S 0,0723 0,0663 0,0660 0,0659 0,0658 0,0658 R-Sq 58,56 65,22 65,50 65,63 65,70 65,77 R-Sq(adj) 58,56 65,21 65,49 65,60 65,67 65,74 Mallows Cp 1178,3 97,7 53,5 35,7 25,5 15,7
42
5.2 Regressão Múltiplas
Primeiramente, foi feita a regressão com os indicadores que apresentaram correlação maior do
0,3000 com IFGF (Liq + Inv + Pes + ReP + R1i + T1_2i - E2_4i + Edu +086 EeR).
Encontramos, como resultado da equação, alguns indicadores que tem uma participação maior
(todos os relacionados com Gestão Fiscal – CD) e outros praticamente inexpressivos para
explicar o IFGF.
5.2.1 Regression Analysis: IFGF versus Liq; Inv; ...
The regression equation is Predictor Coef SE Coef T P Constant 0,090606 0,004538 19,97 0,000 Liq 0,219972 0,000935 235,20 0,000 Inv 0,217941 0,001210 180,19 0,000 Pes 0,232710 0,001784 130,42 0,000 ReP 0,200709 0,002332 86,08 0,000 R1i 0,001870 0,003034 0,62 0,538 T1_2i 0,002148 0,002717 0,79 0,429 E2_4i -0,016561 0,003466 -4,78 0,000 Edu 0,017336 0,004879 3,55 0,000 EeR 0,000865 0,002899 0,30 0,766 S = 0,0240085 R-Sq = 97,4% R-Sq(adj) = 97,4% Analysis of Variance Source DF SS MS F P Regression 9 118,515 13,168 22845,40 0,000 Residual Error 5555 3,202 0,001 Total 5564 121,717 Source DF Seq SS Liq 1 71,431 Inv 1 27,631 Pes 1 11,922 ReP 1 7,514 R1i 1 0,002 T1_2i 1 0,001 E2_4i 1 0,007 Edu 1 0,007 EeR 1 0,000
5.2.2 Regression Analysis: IFGF versus Liq; Inv; Pes; ReP
IFGF = 0,0906 + 0,220 Liq + 0,218 Inv + 0,233 Pes + 0,201 ReP + 0,00187 R1i + 0,00215 T1_2i - 0,0166 E2_4i + 0,0173 Edu + 0,00086 EeR
43
Na Segunda tentativa, expurgando os dados da última análise que não faziam parte dos indicadores de gestão fiscal ((Liq + Inv + Pes + ReP), basicamente, mantivemos o mesmo nível explicativo da equação (97,4%). The regression equation is Predictor Coef SE Coef T P Constant 0,094770 0,001142 82,99 0,000 Liq 0,219657 0,000919 238,95 0,000 Inv 0,217405 0,001192 182,44 0,000 Pes 0,231508 0,001761 131,49 0,000 ReP 0,200214 0,001757 113,92 0,000 S = 0,0240618 R-Sq = 97,4% R-Sq(adj) = 97,4% Analysis of Variance Source DF SS MS F P Regression 4 118,498 29,624 51167,29 0,000 Residual Error 5560 3,219 0,001 Total 5564 121,717 Source DF Seq SS Liq 1 71,431 Inv 1 27,631 Pes 1 11,922 ReP 1 7,514 R denotes an observation with a large standardized residual. X denotes an observation whose X value gives it large leverage.
5.2.3 Regression Analysis: EDUCAÇÀO e RENDA (EeR) versus ReP; T1_2i; R1i; Edu;
E2_4i; IFGF
The regression equation is Predictor Coef SE Coef T P Constant 0,28666 0,02068 13,86 0,000 ReP 0,374592 0,009976 37,55 0,000 T1_2i 0,22841 0,01217 18,77 0,000 R1i -0,07513 0,01399 -5,37 0,000 Edu -0,02858 0,02253 -1,27 0,205 E2_4i -0,05157 0,01596 -3,23 0,001 IFGF -0,03212 0,01198 -2,68 0,007 S = 0,111157 R-Sq = 48,8% R-Sq(adj) = 48,7%
EeR = 0,287 + 0,375 ReP + 0,228 T1_2i - 0,0751 R1i - 0,0286 Edu - 0,0516 E2_4i - 0,0321 IFGF
IFGF = 0,0948 + 0,220 Liq + 0,217 Inv + 0,232 Pes + 0,200 ReP
44
Analysis of Variance Source DF SS MS F P Regression 6 65,380 10,897 881,90 0,000 Residual Error 5558 68,674 0,012 Total 5564 134,054 Source DF Seq SS ReP 1 54,727 T1_2i 1 10,179 R1i 1 0,102 Edu 1 0,127 E2_4i 1 0,155 IFGF 1 0,089
5.2.4 Regression Analysis: EDUCAÇÀO e RENDA versus ReP; T1_2i
The regression equation is EeR = 0,176 + 0,371 ReP + 0,251 T1_2i Predictor Coef SE Coef T P Constant 0,175881 0,004389 40,08 0,000 ReP 0,370749 0,009513 38,97 0,000 T1_2i 0,250527 0,008755 28,61 0,000 S = 0,111500 R-Sq = 48,4% R-Sq(adj) = 48,4% Analysis of Variance Source DF SS MS F P Regression 2 64,906 32,453 2610,41 0,000 Residual Error 5562 69,148 0,012 Total 5564 134,054 Source DF Seq SS ReP 1 54,727 T1_2i 1 10,179
5.2.5 Regression Analysis: EDUCAÇÃO versus E2_4i; R1i; T1_2i; H6i; ReP; IFGF; EeR
The regression equation is Edu = 0,561 + 0,314 E2_4i - 0,187 R1i + 0,0263 T1_2i - 0,0122 H6i + 0,00813 ReP + 0,00572 IFGF - 0,0112 EeR Predictor Coef SE Coef T P Constant 0,56147 0,01199 46,84 0,000 E2_4i 0,313692 0,008635 36,33 0,000 R1i -0,187016 0,009387 -19,92 0,000
EeR = 0,176 + 0,371 ReP + 0,251 T1_2i
Edu = 0,561 + 0,314 E2_4i - 0,187 R1i + 0,0263 T1_2i - 0,0122 H6i + 0,00813 ReP + 0,00572 IFGF - 0,0112 EeR
45
T1_2i 0,026319 0,007557 3,48 0,001 H6i -0,012151 0,008402 -1,45 0,148 ReP 0,008129 0,006718 1,21 0,226 IFGF 0,005724 0,007153 0,80 0,424 EeR -0,011247 0,008021 -1,40 0,161 S = 0,0661726 R-Sq = 65,4% R-Sq(adj) = 65,3% Analysis of Variance Source DF SS MS F P Regression 7 45,9176 6,5597 1498,05 0,000 Residual Error 5557 24,3331 0,0044 Total 5564 70,2507 Source DF Seq SS E2_4i 1 41,1415 R1i 1 4,6758 T1_2i 1 0,0752 H6i 1 0,0094 ReP 1 0,0040 IFGF 1 0,0031 EeR 1 0,0086
5.2.6 Regression Analysis: Edu versus E2_4i; R1i
The regression equation is Edu = 0,574 + 0,313 E2_4i - 0,201 R1i Predictor Coef SE Coef T P Constant 0,574252 0,007825 73,38 0,000 E2_4i 0,313306 0,008473 36,98 0,000 R1i -0,201220 0,006168 -32,63 0,000 S = 0,0662791 R-Sq = 65,2% R-Sq(adj) = 65,2% Analysis of Variance Source DF SS MS F P Regression 2 45,817 22,909 5214,91 0,000 Residual Error 5562 24,433 0,004 Total 5564 70,251 Source DF Seq SS E2_4i 1 41,141 R1i 1 4,676
Edu = 0,574 + 0,313 E2_4i - 0,201 R1i
46
COMPARAÇÕES
6 COMPARAÇÕES - ANOVA
6.1 Variável IFGF por Região
Gráfico 9 – Boxplot de IFGF por Região
A região Sul possui o maior IFGF do país, o que indica que esta é a região melhor gestão
fiscal do Brasil, segundo a pesquisa. A região Sudeste e Centro Oeste encontram-se próxima a
região Sul, e ocupam, empatadas, o segundo lugar. Seguidas pela região Norte e, por último,
com o pior desempenho, pela região Nordeste.
Pelo tamanho da caixa do BloxPlot podemos visualizar a amplitude da variância, ou seja, a
partir da análise gráfica, podemos afirmar que os dados da região Sul possui a menor e o da
região Norte, apesar da pequena diferença, a maior variabilidade de quando comparo com os
dados das demais regiões. A região que possui menor variabilidade dos dados é a Sul. .O P-
value = 0 nos indica que a informação é confiável e não existe chance deste valor ser
diferente.
IFGF One-way ANOVA: IFGF versus Região
47
Source DF SS MS F P Região 4 29,5975 7,3994 446,60 0,000 Error 5560 92,1194 0,0166 Total 5564 121,7169 S = 0,1287 R-Sq = 24,32% R-Sq(adj) = 24,26% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev +---------+---------+---------+--------- Centro-Oeste 468 0,5590 0,1286 (-*-) Nordeste 1790 0,4274 0,1305 (*) Norte 447 0,5229 0,1395 (-*-) Sudeste 1669 0,5619 0,1288 (*) Sul 1191 0,6154 0,1215 (-*) +---------+---------+---------+--------- 0,420 0,480 0,540 0,600 Pooled StDev = 0,1287
O grau de variação entre as Regiões é muito alto (2369), e o P-value nos indica que a informação é confiável e não existe chance deste valor ser diferente.
48
6.2 Variável Receita Própria por Região
Gráfico 10 - Boxplot de Receita Própria por Região
A média para a RECEITA PRÓPRIA é maior para a região Sudeste, sendo que fica muito
próximo da região Sul e Centro-Oeste, diferente do resultado do IFGF, que aponta o Sul com
o melhor IFGF. As menores RECEITAS PRÓPRIAS estão para a região Norte e Nordeste.
Nota-se um diferença sensível entre a média e mediana, sendo a primeira maior. Está
diferença é explicada pela grande quantidade de outlier (pontos fora da curva) que são muitos
e estão muito acima da média em todas as regiões. .O P-value = 0 nos indica que a informação
é confiável e não existe chance deste valor ser diferente.
One-way ANOVA: Receita Própria versus Região Source DF SS MS F P Região 4 30,6761 7,6690 251,78 0,000 Error 5560 169,3519 0,0305 Total 5564 200,0281 S = 0,1745 R-Sq = 15,34% R-Sq(adj) = 15,28% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ----+---------+---------+---------+----- Centro-Oeste 468 0,2824 0,1736 (--*---) Nordeste 1790 0,1366 0,1142 (*-)
49
Norte 447 0,1749 0,1545 (--*--) Sudeste 1669 0,3013 0,2153 (*-) Sul 1191 0,2881 0,1922 (-*-) ----+---------+---------+---------+----- 0,150 0,200 0,250 0,300 Pooled StDev = 0,1745 O grau de variação entre as Regiões é baixo (251,78), e ainda menor que o do IFGF e o P-
value nos indica que a informação é confiável e não existe chance deste valor ser diferente. O
F de 251,78 é aproximadamente a metade do F do IFGF, o que mostra que a variabilidade
entre as regiões é menor na RECEITA PRÓPRIA comparada com o IFGF. .O P-value = 0 nos
indica que a informação é confiável e não existe chance deste valor ser diferente.
6.3 Variável Pessoal (Gastos com Pessoal) por Região
Gráfico 11 - - Boxplot de Gastos com Pessoal por Região
No indicador de PESSOAL, podemos verificar que a Região Sul possui o maior índice de
PESSOAL médio (0,6739), e seguida de perto pelas regiões Sudeste (0,6019) e Centro-Oeste
(0,5903), e os menores índices médios são o da Região Norte (0,5803) e (da Nordeste
(0,5042).
50
Podemos constatar também uma similaridade entre os resultados dos indicadores IFGF e
Receita Própria com os índices de PESSOAL. .O P-value = 0 nos indica que a informação é
confiável e não existe chance deste valor ser diferente.
One-way ANOVA: Pessoal versus Região Source DF SS MS F P Região 4 21,6257 5,4064 155,90 0,000 Error 5560 192,8090 0,0347 Total 5564 214,4347 S = 0,1862 R-Sq = 10,08% R-Sq(adj) = 10,02% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -+---------+---------+---------+-------- Centro-Oeste 468 0,5947 0,1716 (--*--) Nordeste 1790 0,5042 0,2441 (-*-) Norte 447 0,5803 0,2107 (--*---) Sudeste 1669 0,6019 0,1470 (*-) Sul 1191 0,6739 0,1181 (-*-) -+---------+---------+---------+-------- 0,500 0,550 0,600 0,650 Pooled StDev = 0,1862
6.4 Variável Investimentos por Região
Gráfico 12 - - Boxplot de Investimeto por Região
51
Pode-se observar que o índice de INVESTIMENTOS em média, é maior na região Sul, e,
apesar do índice, na região Sudeste ser o segundo melhor, tem a melhor distribuição de todo o
território nacional, a despeito de concentrar o maior número de munícipios, pois tem o menor
nível de dispersão. .O P-value = 0 nos indica que a informação é confiável e não existe chance
deste valor ser diferente.
One-way ANOVA: Investimentos versus Região Source DF SS MS F P Região 4 31,1085 7,7771 105,99 0,000 Error 5560 407,9619 0,0734 Total 5564 439,0704 S = 0,2709 R-Sq = 7,09% R-Sq(adj) = 7,02% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --------+---------+---------+---------+- Centro-Oeste 468 0,5636 0,2910 (---*---) Nordeste 1790 0,5057 0,2732 (-*-) Norte 447 0,6268 0,2923 (---*----) Sudeste 1669 0,6495 0,2492 (-*-) Sul 1191 0,6927 0,2799 (-*--) --------+---------+---------+---------+- 0,540 0,600 0,660 0,720 Pooled StDev = 0,2709
6.5 Variável Liquidez, por Região
O índice de LIQUIDEZ da região Sul é melhor tanto do ponto vista da melhor média e
mediana - que é muito alta, como pelo fato de ter o menor nível de disparidade (baixa
dispersão – 0,3085) quando comparado com as demais regiões. Por outro lado, as regiões
Nordeste e Norte são destaques negativos, a primeira pela pior média de investimentos e
segunda maior dispersão dos índices de investimentos, enquanto a outra tem a segunda pior
média de investimento e a maior dispersão. Destaque, também negativo, para a região Sudeste
que tem valores muito próximos da região, que chama muito a atenção pelo alto nível de
investimento privado e de atividades econômicas. .O P-value = 0 nos indica que a informação
é confiável e não existe chance deste valor ser diferente.
52
Gráfico 13 - Boxplot de Liquidez por Região
. One-way ANOVA: Liquidez versus Região Source DF SS MS F P Região 4 99,409 24,852 204,15 0,000 Error 5560 676,864 0,122 Total 5564 776,273 S = 0,3489 R-Sq = 12,81% R-Sq(adj) = 12,74% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ---+---------+---------+---------+------ Centro-Oeste 468 0,6540 0,3420 (--*---) Nordeste 1790 0,3822 0,3592 (*-) Norte 447 0,5408 0,3850 (--*--) Sudeste 1669 0,5719 0,3565 (*-) Sul 1191 0,7402 0,3085 (-*-) ---+---------+---------+---------+------ 0,40 0,50 0,60 0,70 Pooled StDev = 0,3489
53
6.6 Variável Custo da Divida
Gráfico 14 - - Boxplot de Custo da Divida por Região
Todas as regiões possuem dados fora da curva de distribuição, exclusivamente abaixo, e que
fogem do padrão. Outro fator que chama a atenção é o fato do “F” ser muito baixo, fato este
que indica a uniformidade entre as regiões e pode percebida visualmente nos gráficos. O
destaque positivo referente ao índice da região Norte, pode ser justificado pelo baixo nível de
investimento.
One-way ANOVA: Custo da Dívida versus Região Source DF SS MS F P Região 4 5,7471 1,4368 59,97 0,000 Error 5560 133,2111 0,0240 Total 5564 138,9582 S = 0,1548 R-Sq = 4,14% R-Sq(adj) = 4,07% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ------+---------+---------+---------+--- Centro-Oeste 468 0,8579 0,1377 (---*---) Nordeste 1790 0,8089 0,1666 (-*-) Norte 447 0,8598 0,1329 (---*---) Sudeste 1669 0,8265 0,1402 (-*-) Sul 1191 0,7588 0,1692 (--*-) ------+---------+---------+---------+--- 0,770 0,805 0,840 0,875 Pooled StDev = 0,1548
54
6.7 Variável Emprego e Renda
One-way ANOVA: EeR versus Região_1 Source DF SS MS F P Região_1 4 17,7937 4,4484 212,74 0,000 Error 5560 116,2605 0,0209 Total 5564 134,0542 S = 0,1446 R-Sq = 13,27% R-Sq(adj) = 13,21% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --------+---------+---------+---------+- Centro-Oeste 468 0,4174 0,1389 (--*---) Nordeste 1790 0,3348 0,1288 (-*) Norte 447 0,3415 0,1419 (--*---) Sudeste 1669 0,4491 0,1680 (*-) Sul 1191 0,4620 0,1344 (--*-) --------+---------+---------+---------+- 0,360 0,400 0,440 0,480 Pooled StDev = 0,1446
Boxplot of EeR
Gráfico 15 - Boxplot de Emprego e Renda por Região
No indicador de Emprego e Renda, podemos verificar que a Região Sul possui o maior índice
Médio (0,4624), e seguida da Região Sudeste, e o menor índice é o da Região Nordeste
(0,3348). A maior dispersão, segundo o desvio padrão, é da Região Sudeste, 0,1680.
55
6.8 Variável Educação
One-way ANOVA: Edu versus Região_1 Source DF SS MS F P Região_1 4 35,82737 8,95684 1446,69 0,000 Error 5560 34,42333 0,00619 Total 5564 70,25070 S = 0,07868 R-Sq = 51,00% R-Sq(adj) = 50,96% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- Centro-Oeste 468 0,75299 0,07162 (*-) Nordeste 1790 0,65090 0,08127 *) Norte 447 0,63739 0,08599 (*) Sudeste 1669 0,83427 0,08138 (*) Sul 1191 0,78106 0,07021 (*) -----+---------+---------+---------+---- 0,660 0,720 0,780 0,840 Pooled StDev = 0,07868
Boxplot of Edu
Gráfico 16 - Boxplot de Educação por Região
No indicador de Educação, observa-se que a Região Sudeste possui o maior índice de
Educação (0,83427), e seguida da Região Sul, e o menor índice é o da Região Norte
(0,63739). A maior dispersão, segundo os desvios padrões, está na Região Norte, entretanto, a
diferença é bem pequena.
56
6.9 Variável H6
One-way ANOVA: H6i versus Região_1 Source DF SS MS F P Região_1 4 73,4530 18,3633 1472,35 0,000 Error 5560 69,3446 0,0125 Total 5564 142,7976 S = 0,1117 R-Sq = 51,44% R-Sq(adj) = 51,40% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ----+---------+---------+---------+----- Centro-Oeste 468 0,6321 0,1147 (*) Nordeste 1790 0,4774 0,1044 (* Norte 447 0,3725 0,1728 (*) Sudeste 1669 0,6421 0,1065 *) Sul 1191 0,7330 0,0983 *) ----+---------+---------+---------+----- 0,40 0,50 0,60 0,70 Pooled StDev = 0,1117
Boxplot of H6i
Gráfico 17 - Boxplot de H6 por Região
Na matriz e no Gráfico 17 - Boxplot de H6 por Região pode-se observar que a Região Sul
possui a maior média (0,7330), seguida pela da Região Sudeste. Já o menor índice é o da
Região Norte (0,3725), assim como a maior dispersão, segundo o desvio padrão, 0,1728.
57
6.10 Variável R1
One-way ANOVA: R1i versus Região_1 Source DF SS MS F P Região_1 4 185,3416 46,3354 2688,34 0,000 Error 5560 95,8304 0,0172 Total 5564 281,1720 S = 0,1313 R-Sq = 65,92% R-Sq(adj) = 65,89% Level N Mean StDev Centro-Oeste 468 0,1925 0,1171 Nordeste 1790 0,5388 0,1346 Norte 447 0,5026 0,1928 Sudeste 1669 0,1777 0,1339 Sul 1191 0,1281 0,0940 Individual 95% CIs For Mean Based on Pooled StDev Level +---------+---------+---------+--------- Centro-Oeste (*) Nordeste (* Norte (*) Sudeste (* Sul (* +---------+---------+---------+--------- 0,12 0,24 0,36 0,48 Pooled StDev = 0,1313
Boxplot of R1i
Gráfico 18 - Boxplot de R1 por Região
No indicador de R1, verifica-se que a Região Sul possui a menor média (0,1281), seguida pela Região Sudeste, e que o maior índice é o da Região Nordeste (0,5388). Neste caso a informação diz que a Renda é abaixo da linha da pobreza, então quanto menor melhor.
58
6.11 Variável T1-2
One-way ANOVA: T1_2i versus Região_1 Source DF SS MS F P Região_1 4 102,6832 25,6708 1069,67 0,000 Error 5560 133,4330 0,0240 Total 5564 236,1162 S = 0,1549 R-Sq = 43,49% R-Sq(adj) = 43,45% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -+---------+---------+---------+-------- Centro-Oeste 468 0,5930 0,1337 (*-) Nordeste 1790 0,3928 0,1510 *) Norte 447 0,4486 0,1542 (-*) Sudeste 1669 0,6581 0,1782 (*) Sul 1191 0,7203 0,1321 (*) -+---------+---------+---------+-------- 0,40 0,50 0,60 0,70 Pooled StDev = 0,1549
Boxplot of T1_2i
Gráfico 19 - Boxplot de T1_2 por Região
Na matriz de T1_2 e no Gráfico 19 - Boxplot de T1_2 por Região, verifica-se que a Região
Sul possui a maior média (0,7203), seguida da Região Sudeste, e que a menor média é a da
Região Nordeste (0,3928).
59
6.12 Variável S1_1
One-way ANOVA: S1_1i versus Região_1 Source DF SS MS F P Região_1 4 0,17432 0,04358 24,14 0,000 Error 5560 10,03972 0,00181 Total 5564 10,21404 S = 0,04249 R-Sq = 1,71% R-Sq(adj) = 1,64% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ----+---------+---------+---------+----- Centro-Oeste 468 0,04258 0,05074 (-----*----) Nordeste 1790 0,04741 0,03271 (--*--) Norte 447 0,05346 0,04539 (----*-----) Sudeste 1669 0,04080 0,04173 (--*--) Sul 1191 0,03467 0,05104 (---*--) ----+---------+---------+---------+----- 0,0350 0,0420 0,0490 0,0560 Pooled StDev = 0,04249
Boxplot of S1_1i
Gráfico 20 - Boxplot de S1_1 por Região
No Gráfico 20 - Boxplot de S1_1 por Região e na matriz, verifica-se que a Região Sul possui
a menor média (0,03467) entre as regiões, seguida da Região Sudeste, e que a maior médiae é
a da Região Norte (0,5346). Neste caso a informação diz que a mortalidade infantil, então
quanto menor melhor. Chama a atenção, apesar da concentração próxima dos valores
mínimos da escala, é a quantidade de outlier em todas as regiões.
60
6.13 Variável E2-4
One-way ANOVA: E2_4i versus Região_1 Source DF SS MS F P Região_1 4 76,7930 19,1983 1478,82 0,000 Error 5560 72,1806 0,0130 Total 5564 148,9736 S = 0,1139 R-Sq = 51,55% R-Sq(adj) = 51,51% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -------+---------+---------+---------+-- Centro-Oeste 468 0,8011 0,0887 (*-) Nordeste 1790 0,5881 0,1298 (*) Norte 447 0,5969 0,1841 (*-) Sudeste 1669 0,8245 0,1017 (*) Sul 1191 0,8444 0,0711 (*) -------+---------+---------+---------+-- 0,630 0,700 0,770 0,840 Pooled StDev = 0,1139
Boxplot of E2_4i
Gráfico 21 - Boxplot de E2_4 por Região
A maior dispersão, segundo o desvio padrão, é o da Região Norte (0,1841), e o pior
desempenho, com a menor média é da Região Nordeste, e a região que apresenta a maior
média de E2_4 é a Sul (0,8444), seguida pela da Região Sudeste.
61
6.14 Resumo das variáveis
Figura 14 - Quadro resumo das comparações das variáveis quantitativas
No Figura 14 - Quadro resumo das comparações das variáveis quantitativas, observa-se, tanto
nos indicadores de Gestão Fiscal quanto nos de Desenvolvimento, salvo poucas exceções, um
melhor desempenho nas Regiões Sul e Sudeste, acompanhado de perto pela Região Centro-
Oeste, e os piores desempenhos na Região Norte e Nordeste.
62
7 AMOSTRAGEM
Neste estudo, realizou-se uma amostragem aleatória por meio do software Minitab16 de um
universo de 5565 indivíduos, obtendo-se uma amostra de 50 indivíduos e outra de 100
indivíduos. A partir dessas amostras se estabeleceu comparações entre o universo e as
amostras de 50 e 100 para as variáveis IFGF, Emprego e Renda e Educação. Por meio de duas
ferramentas estatísticas: Estatística Descritiva e Analise de Variância (ANOVA), Observou-se
um comportamento muito próximo tanto nas médias, como nas curvas de distribuição. E,
apesar de um “p” alto (acima de 10%) em todos os casos, nota-se que trabalhar com
amostragem é viável em todos os casos.
Figura 15 - Analise de variância entre IFGF, IFGF100 e IFGF50
Figura 16 - - Analise de variância entre EeR, EeR100 e EeR50.
Figura 17 - - Analise de variância entre Edu, Edu100 e Edu50
63
7.1 Quadro Resumo: Amostragem IFGF
Figura 18 - Quadro resumo comparativo do universo e das amostras 100 e 50 indivíduos - IFGF
64
7.2 Quadro Resumo: Amostragem Emprego e Renda
Figura 19 - Quadro resumo comparativo do universo e das amostras 100 e 50 indivíduos - Emprego e
Renda [EeR]
65
7.3 Qaudro Resumo: Amostragem Educação
Figura 20- Quadro resumo comparativo do universo e das amostras 100 e 50 indivíduos - Educação [Edu]
66
ANÁLISE MULTIVARIADA – COMPONENTES PRINCIPAIS
8 ANÁLISE MULTIVARIADA – COMPONENTES PRINCIPAIS
Esta parte do estudo efetuará analisa as correlações e os componentes principais (análise
multivariada) dos dados quantitativos de gestão Fiscal e de Desenvolvimento dos Municípios
do Brasil.
8.1 Dendograma
8.1.1 Cluster Analysis of Variables: IFGF; ReP; Pes; Inv; Liq; CD; EeR; Edu; ...
Correlation Coefficient Distance, Single Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster 1 12 88,3036 0,233929 1 5 1 2 2 11 88,2635 0,234730 8 13 8 2 3 10 81,9472 0,361056 2 7 2 2 4 9 80,6440 0,387120 8 9 8 3 5 8 80,4258 0,391484 8 11 8 4 6 7 80,0923 0,398153 1 4 1 3 7 6 79,6758 0,406485 1 3 1 4 8 5 79,2961 0,414077 2 8 2 6 9 4 73,1337 0,537326 1 2 1 10 10 3 59,1964 0,816072 1 6 1 11 11 2 57,0157 0,859685 10 12 10 2 12 1 51,4793 0,970413 1 10 1 13 Final Partition Cluster 1 IFGF Pes Inv Liq Cluster 2 ReP EeR Edu H6i T1_2i E2_4i Cluster 3 CD Cluster 4 R1i Cluster 5 S1_1i
67
Gráfico 22 - Dendrograma das Variáveis Quantitativas
Nota-se Gráfico 22 - Dendrograma das Variáveis Quantitativas- que houve uma divisão em
dois grupos, com similaridades muito próximas, em torno de 80%, a saber: Gestão Fiscal
(IFGF, Pes, Inv e Liq) e Desenvolvimento dos munícipios mais Receita Própria (ReP, EeR,
Edu, H6i, T1_2i e E2_4i). Os indicadores CD (custo da dívida) e R1 e S1_1 ficaram isolados
e com um nível de similaridade pouco expressiva.
8.2 Componentes Principais
Principal Component Analysis: IFGF; ReP; Pes; Inv; Liq; CD; EeR; Edu; H6i; R1i;
Principal Component Analysis: IFGF; ReP; Pes; Inv; Liq; CD; EeR; Edu; H6i; R1i; Eigenanalysis of the Correlation Matrix Eigenvalue 5,1005 1,7419 1,2138 0,9680 0,9299 0,8118 0,7206 0,4363 Proportion 0,392 0,134 0,093 0,074 0,072 0,062 0,055 0,034 Cumulative 0,392 0,526 0,620 0,694 0,766 0,828 0,884 0,917 Eigenvalue 0,3856 0,3311 0,2254 0,1239 0,0111 Proportion 0,030 0,025 0,017 0,010 0,001 Cumulative 0,947 0,972 0,990 0,999 1,000 Variable PC1 PC2 PC3 IFGF 0,323 -0,482 -0,182 ReP 0,285 0,161 -0,500 Pes 0,197 -0,364 0,011 Inv 0,154 -0,429 0,115 Liq 0,227 -0,378 -0,188 CD 0,009 -0,325 0,150 EeR 0,270 0,224 -0,489 Edu 0,349 0,153 0,263 H6i 0,297 0,092 0,437 R1i -0,395 -0,187 -0,152 T1_2i 0,357 0,198 -0,118 S1_1i -0,074 -0,069 -0,161 E2 4i 0,359 0,127 0,288
68
Gráfico 23 - Scree Plot das Variáveis Quatitativas
Gráfico 24 - Loading Plot das Váriáveis Quantitativas
69
8.2.1 3D Scatterplot
Gráfico 25 - 3D Scatterplot CP1 vs CP2 vs CP3 (6 ≠s ângulos)
70
ANÁLISE DE CONGLOMERADOS
9 ANÁLISE DE CONGLOMERADOS (DENDROGRAMA E ANOVA)
O Dendrograma permite uma análise do grau de similaridade dos dados para uma determinada
variável. Neste estudo, gerou-se o Dendrograma da média dos indicadores de Gestão Fiscal e de
Desenvolvimento dos municípios, agrupado por Estado e, também, do índice de disparidade das
mesmas variáveis. Os resultados de ambos foram ilustrados no mapa do Brasil, cujo objetivo foi
representar os agrupamentos por similaridade.
9.1 Dendrograma das médias por UF (-DF)
Dendrograma Cluster Analysis of Observations: IFGF_1; ReP_1; Pes_1; Inv_1; Liq_1; CD_1; ... Euclidean Distance, Single Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster 1 25 92,0156 0,088677 11 12 11 2 2 24 88,3952 0,128886 22 23 22 2 3 23 84,9233 0,167445 7 11 7 3 4 22 84,3588 0,173715 1 4 1 2 5 21 84,2452 0,174976 7 18 7 4 6 20 83,3493 0,184926 14 15 14 2 7 19 81,0358 0,210621 8 10 8 2 8 18 80,7794 0,213469 7 20 7 5 9 17 80,6710 0,214673 2 24 2 2 10 16 80,4230 0,217427 14 19 14 3 11 15 80,3559 0,218172 5 16 5 2 12 14 79,4193 0,228574 6 9 6 2 13 13 78,3874 0,240035 6 14 6 5 14 12 76,9561 0,255931 8 17 8 3 15 11 76,1694 0,264668 7 8 7 8 16 10 75,4749 0,272381 7 22 7 10 17 9 75,4070 0,273136 5 6 5 7 18 8 75,3664 0,273587 1 13 1 3 19 7 75,3556 0,273706 5 21 5 8 20 6 75,2288 0,275115 2 5 2 10 21 5 75,0033 0,277620 1 2 1 13 22 4 72,8926 0,301061 7 25 7 11 23 3 72,5827 0,304503 7 26 7 12 24 2 68,9814 0,344500 1 3 1 14 25 1 62,0152 0,421868 1 7 1 26 Final Partition Number of clusters: 2
71
Average Maximum Within distance distance Number of cluster sum from from observations of squares centroid centroid Cluster1 14 0,993035 0,259899 0,403357 Cluster2 12 0,690149 0,228652 0,360914 Cluster Centroids Grand Variable Cluster1 Cluster2 centroid IFGF_1 0,449534 0,592226 0,515392 ReP_1 0,143595 0,286885 0,209729 Pes_1 0,484354 0,617381 0,545751 Inv_1 0,533989 0,662131 0,593131 Liq_1 0,431280 0,692019 0,551621 CD_1 0,812359 0,810015 0,811277 EeR_1 0,345110 0,437046 0,387542 Edu_1 0,638085 0,775075 0,701311 H6i_1 0,385814 0,631739 0,499318 R1i_1 0,557480 0,198668 0,391874 T1_2i_1 0,419244 0,642019 0,522063 S1_1i_1 0,048901 0,041905 0,045672 E2_4i_1 0,577580 0,794151 0,677536 Distances Between Cluster Centroids Cluster1 Cluster2 Cluster1 0,000000 0,675296 Cluster2 0,675296 0,000000
Gráfico 26 - Dendograma similaridade das Médias das UFs
72
Figura 21 - Mapa 2Brasis agrupados pela similaridade das médias
73
9.2 Dendrograma dos índices de variabilidade por UF (-DF)
Cluster Analysis of Observations: IFGF_3; ReP_3; Pes_3; Inv_3; Liq_3; CD_3; ...
Euclidean Distance, Single Linkage Amalgamation Steps Number of obs. Number of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster 1 25 96,1456 0,57921 4 21 4 2 2 24 94,7457 0,78956 1 4 1 3 3 23 94,0161 0,89919 2 24 2 2 4 22 93,3538 0,99873 6 12 6 2 5 21 93,2684 1,01155 6 26 6 3 6 20 93,2480 1,01462 3 11 3 2 7 19 93,0516 1,04414 6 13 6 4 8 18 92,7325 1,09209 1 20 1 4 9 17 92,4101 1,14053 3 7 3 3 10 16 91,5827 1,26487 6 19 6 5 11 15 91,1278 1,33323 2 3 2 5 12 14 90,8436 1,37593 9 16 9 2 13 13 90,6761 1,40111 6 15 6 6 14 12 90,4710 1,43192 9 14 9 3 15 11 90,0598 1,49372 1 2 1 9 16 10 89,0664 1,64299 1 18 1 10 17 9 88,7728 1,68712 6 9 6 9 18 8 88,7155 1,69573 1 6 1 19 19 7 87,2171 1,92089 1 8 1 20 20 6 85,8394 2,12791 1 23 1 21 21 5 82,3057 2,65893 5 17 5 2 22 4 81,7073 2,74885 1 5 1 23 23 3 79,9386 3,01462 1 22 1 24 24 2 73,5334 3,97714 1 25 1 25 25 1 70,5814 4,42073 1 10 1 26 Final Partition Number of clusters: 5 Average Maximum Within distance distance Number of cluster sum from from observations of squares centroid centroid Cluster1 21 133,038 2,32851 3,77625 Cluster2 2 3,535 1,32946 1,32946 Cluster3 1 0,000 0,00000 0,00000 Cluster4 1 0,000 0,00000 0,00000 Cluster5 1 0,000 0,00000 0,00000 Cluster Centroids Grand Variable Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 centroid IFGF_3 1,31127 2,52731 3,5576 2,15384 3,23234 1,59750 ReP_3 1,53419 3,02419 4,9000 3,89475 6,08506 2,04408 Pes_3 2,12936 2,97278 3,9956 2,85628 3,72916 2,35551
74
Inv_3 2,82973 5,23032 7,3591 6,02384 6,18119 3,44035 Liq_3 3,55278 7,38918 10,3491 4,80378 9,10798 4,37106 CD_3 1,56540 3,23113 3,6286 3,29278 4,02161 1,93379 EeR_3 1,44602 2,57464 4,0685 2,99563 4,25937 1,80151 Edu_3 0,69498 1,32235 1,8125 1,71905 1,29259 0,84860 H6i_3 0,92036 1,76921 2,6204 2,33536 2,72950 1,17505 R1i_3 1,30755 2,17421 4,3150 2,06077 1,73256 1,53521 T1_2i_3 1,44688 2,75370 5,1334 2,94315 2,67131 1,79384 S1_1i_3 0,38858 0,67100 1,3387 1,45400 1,01626 0,51197 E2_4i_3 1,08873 1,86084 2,6469 1,71584 1,33305 1,24157 Distances Between Cluster Centroids Cluster1 Cluster2 Cluster3 Cluster4 Cluster5 Cluster1 0,0000 5,76094 11,3050 5,59898 9,42149 Cluster2 5,7609 0,00000 5,7951 3,09301 4,39117 Cluster3 11,3050 5,79510 0,0000 6,99465 4,42073 Cluster4 5,5990 3,09301 6,9946 0,00000 5,31589 Cluster5 9,4215 4,39117 4,4207 5,31589 0,00000
Dendrogram
Gráfico 27 - Dendrograma dos Índices de Variabilidade das UFs.
75
Figura 22 - Mapa 2Brasis agrupamento por similaridade dos índices de variabilidade.
Para se chegar ao índice de variabilidade (disparidade), utilizou-se do seguinte cálculo:
ID= Índice de Disparidade
s= Desvio Padrão da Média (do Estado)
n= Número de Indivíduos (Munícipios do Estado)
76
9.3 Análise das variâncias dos agrupamentos das UFs
Neste tópico, será feita a análise das variâncias de três indicadores: IFGF, Emprego e Renda e
Educação, sendo estes analisados por meio de duas variáveis categóricas: Região e UFs, gerando
seis matrizes e gráficos tipo Boxplot. Os gráficos e análises foram concentradas em um quadro
resumo ao final deste tópico.
9.3.1 Região - IFGF
One-way ANOVA: IFGF_1 versus Região_1 Source DF SS MS F P Região_1 4 0,12961 0,03240 12,67 0,000 Error 21 0,05370 0,00256 Total 25 0,18331 S = 0,05057 R-Sq = 70,71% R-Sq(adj) = 65,13% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -+---------+---------+---------+-------- Centro-Oeste 3 0,57671 0,04893 (-------*-------) Nordeste 9 0,42725 0,03656 (---*----) Norte 7 0,52092 0,06449 (----*----) Sudeste 4 0,58349 0,03820 (------*------) Sul 3 0,61481 0,06663 (-------*------) -+---------+---------+---------+-------- 0,400 0,480 0,560 0,640 Pooled StDev = 0,05057
9.3.2 UFs - IFGF
One-way ANOVA: IFGF versus UF2 Source DF SS MS F P UF2 25 40,5716 1,6229 110,77 0,000 Error 5538 81,1359 0,0147 Total 5563 121,7075 S = 0,1210 R-Sq = 33,34% R-Sq(adj) = 33,03% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ------+---------+---------+---------+--- AC 22 0,4782 0,1469 (----*----) AL 101 0,4261 0,1260 (--*-) AM 62 0,5373 0,1164 (--*--) AP 16 0,4687 0,1373 (-----*-----) BA 416 0,4302 0,1245 (*) CE 184 0,4723 0,1106 (-*-) ES 78 0,6003 0,1236 (--*--) GO 247 0,5211 0,1259 (*-) MA 217 0,4778 0,1177 (-*) MG 852 0,5269 0,1219 (*
77
MS 78 0,6129 0,1069 (-*--) MT 142 0,5961 0,1232 (-*-) PA 142 0,4340 0,1254 (-*-) PB 222 0,3605 0,1403 (-*-) PE 185 0,3889 0,1436 (-*-) PI 223 0,4387 0,1200 (-*) PR 399 0,5381 0,1260 (*) RJ 92 0,6103 0,1189 (-*--) RN 167 0,4215 0,1220 (-*-) RO 52 0,6110 0,0969 (--*--) RR 15 0,5300 0,0951 (-----*-----) RS 497 0,6579 0,0966 (*) SC 295 0,6484 0,1013 (-*) SE 75 0,4292 0,1261 (--*--) SP 647 0,5965 0,1271 (*) TO 138 0,5872 0,1235 (-*-) ------+---------+---------+---------+--- 0,40 0,50 0,60 0,70 Pooled StDev = 0,1210
9.3.3 Região - Emprego e Renda
One-way ANOVA: EeR_1 versus Região_1 Source DF SS MS F P Região_1 4 0,07964 0,01991 10,45 0,000 Error 21 0,04002 0,00191 Total 25 0,11966 S = 0,04365 R-Sq = 66,56% R-Sq(adj) = 60,19% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev --------+---------+---------+---------+- Centro-Oeste 3 0,42359 0,01650 (--------*-------) Nordeste 9 0,33946 0,04268 (----*----) Norte 7 0,35261 0,03993 (-----*----) Sudeste 4 0,47263 0,06870 (-------*------) Sul 3 0,46378 0,02421 (-------*--------) --------+---------+---------+---------+- 0,360 0,420 0,480 0,540 Pooled StDev = 0,04365
9.3.4 UFs – Emprego e Renda
One-way ANOVA: EeR versus UF2 Source DF SS MS F P UF2 25 28,6693 1,1468 60,27 0,000 Error 5538 105,3773 0,0190 Total 5563 134,0466 S = 0,1379 R-Sq = 21,39% R-Sq(adj) = 21,03% Individual 95% CIs For Mean Based on
78
Pooled StDev Level N Mean StDev ------+---------+---------+---------+--- AC 22 0,3718 0,1183 (------*-------) AL 101 0,3174 0,1295 (---*--) AM 62 0,3027 0,1306 (---*---) AP 16 0,3807 0,1789 (--------*-------) BA 416 0,3515 0,1283 (-*-) CE 184 0,3189 0,1271 (--*-) ES 78 0,4521 0,1378 (---*--) GO 247 0,4052 0,1432 (-*-) MA 217 0,2890 0,1309 (-*-) MG 852 0,3844 0,1394 (*) MS 78 0,4371 0,1331 (---*--) MT 142 0,4284 0,1332 (--*-) PA 142 0,3741 0,1506 (--*--) PB 222 0,3212 0,1101 (-*-) PE 185 0,3864 0,1365 (-*--) PI 223 0,3064 0,1168 (-*--) PR 399 0,4383 0,1268 (-*) RJ 92 0,5319 0,1921 (--*---) RN 167 0,3392 0,1088 (-*--) RO 52 0,3976 0,1289 (----*---) RR 15 0,3471 0,1740 (-------*--------) RS 497 0,4665 0,1344 (*-) SC 295 0,4866 0,1398 (-*-) SE 75 0,4251 0,1385 (---*---) SP 647 0,5221 0,1675 (*-) TO 138 0,2943 0,1189 (--*--) ------+---------+---------+---------+--- 0,320 0,400 0,480 0,560 Pooled StDev = 0,1379
9.3.5 Região - Educação
One-way ANOVA: Edu_1 versus Região_1 Source DF SS MS F P Região_1 4 0,14731 0,03683 17,71 0,000 Error 21 0,04367 0,00208 Total 25 0,19098 S = 0,04560 R-Sq = 77,13% R-Sq(adj) = 72,78% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ------+---------+---------+---------+--- Centro-Oeste 3 0,74618 0,01921 (------*------) Nordeste 9 0,65960 0,04758 (---*---) Norte 7 0,62663 0,04790 (---*----) Sudeste 4 0,82912 0,05693 (-----*-----) Sul 3 0,78543 0,02586 (------*------) ------+---------+---------+---------+--- 0,640 0,720 0,800 0,880 Pooled StDev = 0,04560
9.3.6 UFs - Educação
79
One-way ANOVA: Edu versus UF2 Source DF SS MS F P UF2 25 47,07648 1,88306 450,12 0,000 Error 5538 23,16814 0,00418 Total 5563 70,24462 S = 0,06468 R-Sq = 67,02% R-Sq(adj) = 66,87% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ----+---------+---------+---------+----- AC 22 0,58892 0,08581 (--*--) AL 101 0,60578 0,06785 (-*) AM 62 0,61479 0,06003 (*-) AP 16 0,60567 0,03819 (---*--) BA 416 0,59061 0,06767 (*) CE 184 0,73541 0,04756 (* ES 78 0,84199 0,05457 (*-) GO 247 0,76734 0,07622 (*) MA 217 0,63245 0,07051 (*) MG 852 0,78568 0,06210 (* MS 78 0,72983 0,05297 (*) MT 142 0,74137 0,06685 (*) PA 142 0,58226 0,07192 (*) PB 222 0,65751 0,06866 (*) PE 185 0,66662 0,06338 (*) PI 223 0,65258 0,07257 (*) PR 399 0,78194 0,06330 *) RJ 92 0,78439 0,06950 (*-) RN 167 0,71961 0,07062 (*) RO 52 0,69039 0,05534 (-*-) RR 15 0,60517 0,05907 (---*--) RS 497 0,76149 0,07711 *) SC 295 0,81286 0,05324 *) SE 75 0,67580 0,05106 (-*) SP 647 0,90442 0,05082 *) TO 138 0,69921 0,07383 (*) ----+---------+---------+---------+----- 0,60 0,70 0,80 0,90 Pooled StDev = 0,06468
80
9.3.7 Resumo dos Boxplot
No boxplot das três variáveis, IFGF, Emprego e Renda e Educação, observa-se um desempenho
muito abaixo, senão o pior, o segundo pior, da região Nordeste alternando o posto com a região
Norte. Um desempenho semelhante, porém inverso, acontece com as regiões Sudeste e Sul,
alternando a posição de melhor e segundo melhor desempenho. A região Centro –Oeste ocupa
uma zona intermediária em todos os casos.
81
ANÁLISE DISCRIMINANTE LINEAR
10 ANÁLISE DISCRIMINANTE LINEAR POR REGIÃO
Neste estudo avaliaremos a análise discriminante linear em três grupos: primeiro pelas regiões
politicas do Brasil (Norte, Nordeste, Centro-Oeste, Sudeste e Sul), segundo pelo agrupamento
dos estados por similaridades de médias (2BrasisM) e, por fim, o agrupamento dos estados por
similaridade de variabilidade (2BraisV), como explicado no tópico anterior.
10.1 Cinco Regiões Brasileiras – Mapa Político
Discriminant Analysis: Região versus IFGF; ReP; ... Linear Method for Response: Região Predictors: IFGF; ReP; Pes; Inv; Liq; CD; EeR; Edu; H6i; R1i; T1_2i; S1_1i; E2_4i Group Centro-Oeste Nordeste Norte Sudeste Sul Count 467 1790 447 1669 1191 Summary of classification True Group Put into Group Centro-Oeste Nordeste Norte Sudeste Sul Centro-Oeste 292 63 76 254 207 Nordeste 14 1296 62 114 7 Norte 29 373 271 25 7 Sudeste 76 36 19 1080 101 Sul 56 22 19 196 869 Total N 467 1790 447 1669 1191 N correct 292 1296 271 1080 869 Proportion 0,625 0,724 0,606 0,647 0,730 N = 5564 N Correct = 3808 Proportion Correct = 0,684
Este agrupamento, por regiões politicas, obteve o menor nível de acerto, 68,4%.
10.2 2 Brasis – similaridade nas médias
Discriminant Analysis: BrasisM versus IFGF; ReP; ... Linear Method for Response: BrasisM Predictors: IFGF; ReP; Pes; Inv; Liq; CD; EeR; Edu; H6i; R1i; T1_2i; S1_1i; E2_4i
82
Group NN SSO Count 2047 3517 Summary of classification True Group Put into Group NN SSO NN 1939 258 SSO 108 3259 Total N 2047 3517 N correct 1939 3259 Proportion 0,947 0,927 N = 5564 N Correct = 5198 Proportion Correct = 0,934
Este agrupamento, por similaridade de médias, obteve o melhor nível de acerto, 93,4%.
10.3 2 Brasis – similaridade nos índices de “variabilidade”
Discriminant Analysis: BrasisV versus IFGF; ReP; ... Linear Method for Response: BrasisV Predictors: IFGF; ReP; Pes; Inv; Liq; CD; EeR; Edu; H6i; R1i; T1_2i; S1_1i; E2_4i Group AA BB Count 2811 2753 Summary of classification True Group Put into Group AA BB AA 2246 837 BB 565 1916 Total N 2811 2753 N correct 2246 1916 Proportion 0,799 0,696 N = 5564 N Correct = 4162 Proportion Correct = 0,748
Este agrupamento, por similaridades de variabilidade, obteve o segundo menor e, também, o
segundo melhor nível de acerto, 74,8%.
83
REGRESSÃO LOGISTICA
11 REGRESSÃO LOGISTICA
11.1 Regressão – REGIÃO
Nominal Logistic Regression: Região versus IFGF; ReP; ... Response Information Variable Value Count Região Sul 1191 (Reference Event) Sudeste 1669 Norte 447 Nordeste 1790 Centro-Oeste 467 Total 5564 Logistic Regression Table Predictor Coef SE Coef Z P Odds Ratio Logit 1: (Sudeste/Sul) Constant -6,29739 1,07355 -5,87 0,000 IFGF 2,21004 3,69633 0,60 0,550 9,12 ReP 1,68500 0,857669 1,96 0,049 5,39 Pes -5,10688 0,900066 -5,67 0,000 0,01 Inv -0,701754 0,830755 -0,84 0,398 0,50 Liq -1,84472 0,817397 -2,26 0,024 0,16 CD 3,88456 0,513594 7,56 0,000 48,65 EeR 0,424143 0,483144 0,88 0,380 1,53 Edu 28,8102 1,13511 25,38 0,000 3,25156E+12 H6i -10,4277 0,657448 -15,86 0,000 0,00 R1i 7,47527 0,813318 9,19 0,000 1763,87 T1_2i -5,38330 0,543553 -9,90 0,000 0,00 S1_1i 2,57008 1,11783 2,30 0,021 13,07 E2_4i -8,42022 0,839762 -10,03 0,000 0,00 Logit 2: (Norte/Sul) Constant 16,8729 1,58613 10,64 0,000 IFGF 6,09246 4,77641 1,28 0,202 442,51 ReP 1,84896 1,18559 1,56 0,119 6,35 Pes -6,20702 1,20036 -5,17 0,000 0,00 Inv -1,76521 1,07112 -1,65 0,099 0,17 Liq -1,62191 1,05241 -1,54 0,123 0,20 CD 4,61456 0,746388 6,18 0,000 100,94 EeR -0,503830 0,783254 -0,64 0,520 0,60 Edu 9,20113 1,56370 5,88 0,000 9908,28 H6i -26,3474 1,01651 -25,92 0,000 0,00 R1i 7,07164 1,05626 6,70 0,000 1178,08 T1_2i -7,89160 0,789207 -10,00 0,000 0,00 S1_1i 5,10734 1,96405 2,60 0,009 165,23 E2_4i -10,4796 1,08241 -9,68 0,000 0,00 Logit 3: (Nordeste/Sul) Constant 10,7929 1,40343 7,69 0,000 IFGF -6,80705 4,45295 -1,53 0,126 0,00 ReP 3,71225 1,09388 3,39 0,001 40,95 Pes -4,28886 1,09811 -3,91 0,000 0,01
84
Inv -0,227728 1,00206 -0,23 0,820 0,80 Liq -0,0288958 0,986915 -0,03 0,977 0,97 CD 4,11702 0,663455 6,21 0,000 61,38 EeR 2,74552 0,700559 3,92 0,000 15,57 Edu 14,5120 1,39206 10,42 0,000 2006772,04 H6i -15,9048 0,875663 -18,16 0,000 0,00 R1i 14,0949 0,964915 14,61 0,000 1322355,96 T1_2i -8,70142 0,700630 -12,42 0,000 0,00 S1_1i 0,467043 1,79240 0,26 0,794 1,60 E2_4i -12,0802 0,992012 -12,18 0,000 0,00 Logit 4: (Centro-Oeste/Sul) Constant 9,23403 1,29430 7,13 0,000 IFGF 10,3909 4,03008 2,58 0,010 32562,41 ReP 0,511376 0,933951 0,55 0,584 1,67 Pes -7,12944 0,996022 -7,16 0,000 0,00 Inv -3,70663 0,913295 -4,06 0,000 0,02 Liq -2,55008 0,881991 -2,89 0,004 0,08 CD 5,24912 0,619583 8,47 0,000 190,40 EeR -0,315528 0,580477 -0,54 0,587 0,73 Edu 7,04617 1,21829 5,78 0,000 1148,45 H6i -12,5286 0,800891 -15,64 0,000 0,00 R1i -1,41425 0,962671 -1,47 0,142 0,24 T1_2i -8,95603 0,650139 -13,78 0,000 0,00 S1_1i 2,71986 1,35801 2,00 0,045 15,18 E2_4i -3,37804 0,969033 -3,49 0,000 0,03 95% CI Predictor Lower Upper Logit 1: (Sudeste/Sul) Constant IFGF 0,01 12768,16 ReP 1,00 28,96 Pes 0,00 0,04 Inv 0,10 2,53 Liq 0,03 0,78 CD 17,78 133,11 EeR 0,59 3,94 Edu 3,51470E+11 3,00813E+13 H6i 0,00 0,00 R1i 358,24 8684,91 T1_2i 0,00 0,01 S1_1i 1,46 116,86 E2_4i 0,00 0,00 Logit 2: (Norte/Sul) Constant IFGF 0,04 5147649,74 ReP 0,62 64,89 Pes 0,00 0,02 Inv 0,02 1,40 Liq 0,03 1,55 CD 23,38 435,92 EeR 0,13 2,80 Edu 462,35 212335,49 H6i 0,00 0,00 R1i 148,62 9338,11 T1_2i 0,00 0,00 S1_1i 3,52 7760,53 E2_4i 0,00 0,00 Logit 3: (Nordeste/Sul) Constant IFGF 0,00 6,82 ReP 4,80 349,40 Pes 0,00 0,12
85
Inv 0,11 5,68 Liq 0,14 6,72 CD 16,72 225,28 EeR 3,94 61,47 Edu 131092,33 30719828,43 H6i 0,00 0,00 R1i 199531,33 8763662,87 T1_2i 0,00 0,00 S1_1i 0,05 53,52 E2_4i 0,00 0,00 Logit 4: (Centro-Oeste/Sul) Constant IFGF 12,09 87725362,42 ReP 0,27 10,40 Pes 0,00 0,01 Inv 0,00 0,15 Liq 0,01 0,44 CD 56,53 641,29 EeR 0,23 2,28 Edu 105,46 12506,14 H6i 0,00 0,00 R1i 0,04 1,60 T1_2i 0,00 0,00 S1_1i 1,06 217,35 E2_4i 0,01 0,23 Log-Likelihood = -3764,004 Test that all slopes are zero: G = 8791,693, DF = 52, P-Value = 0,000 Goodness-of-Fit Tests Method Chi-Square DF P Pearson 789113 22200 0,000 Deviance 7528 22200 1,000
11.2 Regressão Logística – 2 Brasis – similaridade pelas médias
Não foi possível, pois é necessário que haja pelos menos três grupos, como no caso há somente 2
grupos está ferramenta estatística não pode ser usada.
11.3 Regressão Logística – 2 Brasis – similaridade pelos índices de “variabilidade”
Não foi possível, pois é necessário que haja pelos menos três grupos, como no caso há somente 2
grupos está ferramenta estatística não pode ser usada.
86
ANÁLISE DE CORRESPONDÊNCIA
12 ANÁLISE DE CORRESPONDÊNCIA DOS ÍNDICES DE GESTÃO FISCAL E DE
DESENVOLVIMENTO
Para se gerar o gráfico e facilitar a leitura, usar-se-á siglas que representem as variáveis
quantitativas deste projeto, assim como as siglas das unidades federativas para representa-los.
Abaixo, elenca-se na tabela abaixo as siglas das variáveis quantitativas:
Indicador Sigla Descrição IFGF_1 If IFGF ReP_1 Rp Receita Própria Pes_1 P Gastos com Pessoal Inv_1 In Investimento Liq_1 L Liquidez CD_1 C Custo da Divida EeR_1 Er Emprego e Renda Edu_1 Ed Educação H6i_1 H Habitação R1i_1 R1 Renda T1_2i_1 T1 Trabalho S1_1i_1 S1 Saúde E2_4i_1 E2 Educação – série correta
No Gráfico 26 - Symetric Plot [todas as variáveis quantitativas do projeto] - se observa dois
grandes grupos distribuídos nos quadrantes à esquerda e a direita, sendo no primeiro os estados
que compõem a regiões Norte e Nordeste, excetuando-se os estados do Tocantins que ficou no
centro da linha que divide a componente 1 e de Rondônia que ficou no quadrante a direita, e no
segundo todos os estados que compõem as regiões Centro-Oeste, Sudeste e Sul. No que diz
respeito as variáveis, nota-se que há um distanciamento muito grande de R1dos demais pontos e,
por esta razão, optou-se por refazer a análise excluindo esta variável.
87
Gráfico 28 - Symetric Plot [todas as variáveis quantitativas do projeto]
Simple Correspondence Analysis: IFGF_1; ReP_1; Pes_1; Inv_1; Liq_1; CD_1; EeR_1 Analysis of Contingency Table Axis Inertia Proportion Cumulative Histogram 1 0,0303 0,6804 0,6804 ****************************** 2 0,0054 0,1212 0,8017 ***** 3 0,0034 0,0763 0,8779 *** 4 0,0026 0,0573 0,9353 ** 5 0,0009 0,0194 0,9547 6 0,0007 0,0147 0,9694 7 0,0005 0,0118 0,9812 8 0,0004 0,0086 0,9898 9 0,0003 0,0070 0,9968 10 0,0001 0,0020 0,9988 11 0,0000 0,0011 0,9999 12 0,0000 0,0001 1,0000 Total 0,0446 Row Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 AC 0,889 0,036 0,028 -0,167 0,797 0,033 -0,057 0,093 0,021 2 AL 0,502 0,035 0,038 -0,156 0,502 0,028 -0,003 0,000 0,000 3 AM 0,946 0,036 0,091 -0,270 0,642 0,085 -0,185 0,304 0,227 4 AP 0,596 0,035 0,035 -0,137 0,419 0,022 -0,089 0,177 0,051 5 BA 0,596 0,034 0,027 -0,110 0,345 0,013 0,093 0,250 0,055 6 CE 0,634 0,037 0,035 -0,152 0,546 0,028 0,061 0,088 0,025
88
7 ES 0,826 0,043 0,026 0,148 0,820 0,031 -0,012 0,006 0,001 8 GO 0,865 0,040 0,035 0,167 0,723 0,037 0,074 0,142 0,041 9 MA 0,865 0,035 0,059 -0,254 0,864 0,075 0,008 0,001 0,000 10 MG 0,897 0,041 0,019 0,114 0,610 0,017 0,078 0,287 0,046 11 MS 0,951 0,043 0,028 0,155 0,820 0,034 -0,062 0,131 0,030 12 MT 0,966 0,042 0,019 0,135 0,889 0,025 -0,040 0,077 0,012 13 PA 0,810 0,032 0,046 -0,227 0,808 0,055 0,010 0,002 0,001 14 PB 0,901 0,032 0,032 -0,156 0,543 0,026 0,127 0,359 0,095 15 PE 0,656 0,034 0,033 -0,112 0,293 0,014 0,124 0,363 0,098 16 PI 0,811 0,034 0,044 -0,207 0,754 0,049 0,057 0,057 0,021 17 PR 0,897 0,041 0,045 0,202 0,833 0,055 0,056 0,064 0,024 18 RJ 0,792 0,043 0,047 0,188 0,714 0,050 -0,062 0,079 0,031 19 RN 0,846 0,035 0,019 -0,101 0,427 0,012 0,100 0,419 0,064 20 RO 0,658 0,042 0,024 0,101 0,406 0,014 -0,079 0,251 0,049 21 RR 0,725 0,036 0,058 -0,204 0,583 0,050 -0,101 0,143 0,068 22 RS 0,932 0,046 0,055 0,220 0,911 0,073 -0,033 0,021 0,009 23 SC 0,957 0,047 0,062 0,239 0,955 0,087 -0,011 0,002 0,001 24 SE 0,340 0,036 0,024 -0,092 0,286 0,010 0,040 0,054 0,011 25 SP 0,833 0,045 0,062 0,227 0,829 0,076 0,017 0,004 0,002 26 TO 0,222 0,041 0,009 -0,013 0,016 0,000 -0,046 0,206 0,016 Column Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 If 0,827 0,080 0,009 0,020 0,086 0,001 -0,060 0,741 0,053 2 Rp 0,739 0,033 0,066 0,256 0,725 0,070 -0,035 0,014 0,007 3 P 0,045 0,085 0,023 0,002 0,000 0,000 -0,024 0,045 0,009 4 In 0,127 0,092 0,048 -0,019 0,016 0,001 -0,051 0,111 0,044 5 L 0,729 0,085 0,097 0,115 0,258 0,037 -0,155 0,471 0,378 6 C 0,744 0,126 0,047 -0,111 0,732 0,051 0,014 0,013 0,005 7 Er 0,150 0,060 0,019 0,042 0,126 0,003 0,018 0,023 0,004 8 Ed 0,541 0,109 0,013 0,002 0,001 0,000 0,054 0,541 0,058 9 H 0,853 0,077 0,116 0,170 0,429 0,073 0,169 0,424 0,407 10 R1 0,993 0,061 0,475 -0,589 0,993 0,694 0,011 0,000 0,001 11 T1 0,641 0,081 0,050 0,133 0,637 0,047 -0,011 0,005 0,002 12 S1 0,735 0,007 0,009 -0,200 0,733 0,009 -0,011 0,002 0,000 13 E2 0,469 0,105 0,027 0,060 0,322 0,013 0,041 0,147 0,033
89
Symmetric Plot
Gráfico 29 - Symetric Plot [todas as variáveis quantitativas do projeto - R1]
No Gráfico 27 - Symetric Plot [todas as variáveis quantitativas do projeto - R1],assim como no
anterior, observa-se um comportamento semelhante quanto a divisão das regiões, em direita e
esquerda, porém o centro da escala da componente 1 não é mais a referência que divide os
grupos. No grupo da esquerda, é distinta a separação das regiões Norte predominantemente no
quadrante inferior e a Nordeste no quadrante superior. Simple Correspondence Analysis: IFGF_1; ReP_1; Pes_1; Inv_1; Liq_1; CD_1; EeR_1 Analysis of Contingency Table Axis Inertia Proportion Cumulative Histogram 1 0,0091 0,3839 0,3839 ****************************** 2 0,0058 0,2447 0,6286 ******************* 3 0,0034 0,1440 0,7726 *********** 4 0,0027 0,1149 0,8875 ******** 5 0,0009 0,0393 0,9268 *** 6 0,0007 0,0293 0,9561 ** 7 0,0005 0,0215 0,9775 * 8 0,0003 0,0142 0,9918 * 9 0,0001 0,0056 0,9974 10 0,0001 0,0024 0,9998 11 0,0000 0,0002 1,0000 Total 0,0238
90
Row Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 AC 0,716 0,035 0,026 -0,100 0,570 0,038 -0,051 0,145 0,015 2 AL 0,015 0,033 0,029 0,005 0,001 0,000 -0,017 0,014 0,002 3 AM 0,889 0,034 0,105 -0,178 0,425 0,116 -0,186 0,465 0,199 4 AP 0,416 0,034 0,052 -0,086 0,204 0,028 -0,088 0,212 0,045 5 BA 0,378 0,033 0,032 0,001 0,000 0,000 0,094 0,378 0,050 6 CE 0,585 0,036 0,047 -0,106 0,358 0,044 0,084 0,226 0,044 7 ES 0,461 0,045 0,015 0,059 0,423 0,017 -0,018 0,038 0,002 8 GO 0,739 0,042 0,030 0,093 0,512 0,040 0,062 0,227 0,028 9 MA 0,835 0,034 0,057 -0,179 0,803 0,119 0,036 0,032 0,007 10 MG 0,826 0,042 0,017 0,048 0,235 0,011 0,076 0,591 0,042 11 MS 0,848 0,044 0,019 0,064 0,392 0,020 -0,068 0,455 0,036 12 MT 0,888 0,044 0,010 0,052 0,508 0,013 -0,045 0,380 0,015 13 PA 0,696 0,031 0,049 -0,158 0,666 0,084 0,034 0,030 0,006 14 PB 0,794 0,031 0,036 -0,049 0,087 0,008 0,140 0,707 0,104 15 PE 0,534 0,033 0,045 -0,008 0,002 0,000 0,132 0,532 0,098 16 PI 0,525 0,033 0,043 -0,107 0,361 0,041 0,072 0,164 0,029 17 PR 0,736 0,043 0,038 0,117 0,651 0,065 0,042 0,085 0,013 18 RJ 0,573 0,044 0,044 0,091 0,349 0,040 -0,073 0,223 0,041 19 RN 0,895 0,034 0,029 -0,067 0,218 0,016 0,117 0,677 0,080 20 RO 0,538 0,043 0,034 0,049 0,128 0,011 -0,087 0,410 0,056 21 RR 0,598 0,035 0,071 -0,147 0,445 0,082 -0,086 0,153 0,044 22 RS 0,802 0,048 0,038 0,113 0,686 0,067 -0,046 0,116 0,018 23 SC 0,830 0,049 0,039 0,123 0,798 0,081 -0,025 0,033 0,005 24 SE 0,052 0,035 0,034 -0,003 0,000 0,000 0,035 0,051 0,007 25 SP 0,491 0,047 0,041 0,101 0,489 0,053 0,007 0,002 0,000 26 TO 0,267 0,041 0,019 -0,035 0,113 0,006 -0,041 0,154 0,012 Column Contributions Component 1 Component 2 ID Name Qual Mass Inert Coord Corr Contr Coord Corr Contr 1 If 0,848 0,085 0,017 -0,030 0,198 0,009 -0,055 0,651 0,044 2 Rp 0,625 0,035 0,105 0,204 0,574 0,157 -0,061 0,052 0,022 3 P 0,196 0,090 0,052 -0,050 0,181 0,024 -0,015 0,016 0,003 4 In 0,354 0,098 0,109 -0,091 0,317 0,090 -0,031 0,036 0,016 5 L 0,782 0,091 0,170 0,072 0,118 0,052 -0,172 0,664 0,463 6 C 0,729 0,134 0,150 -0,136 0,690 0,270 0,032 0,039 0,024 7 Er 0,038 0,064 0,034 0,015 0,018 0,002 0,016 0,020 0,003 8 Ed 0,673 0,116 0,032 -0,030 0,137 0,012 0,060 0,536 0,071 9 H 0,855 0,082 0,199 0,164 0,470 0,244 0,149 0,385 0,313 10 T1 0,552 0,086 0,071 0,100 0,517 0,095 -0,026 0,036 0,010 11 S1 0,673 0,008 0,023 -0,218 0,669 0,039 0,017 0,004 0,000 12 E2 0,256 0,112 0,039 0,023 0,062 0,006 0,040 0,194 0,031
91
ÁRVORE DE CLASSIFICAÇÃO
13 ÁRVORE CLASSIFICATÓRIA
Com a técnica de árvore classificatória foi desenvolvida três analises: a primeira (item 13.1)
tendo como variável categórica as Regiões Politicas do Brasil, segundo (item 13.2) os dois Brasis
(Brasis_M) divididos ou agrupados por similaridade das médias e, por último (item 13.3), os dois
Brasis agrupados por similaridade de variabilidade.
No Gráfico 29 - Árvore Classificatória - Regiões do Brasil, os agrupamentos foram feitos a partir
da divisão politica-administrativa dos estados: Norte, Nordeste, Cento-Oeste, Sudeste e Sul, e
com 6 “nós” conseguiu um percentual global de acerto de 80%.
E, no Gráfico 30 - Árvore Classificatória - 2Brasis agrupados pela similaridade das médias, os
agrupamentos forma feitos a partir da similaridade das médias dos indicadores de Gestão Fiscal e
Desenvolvimento dos munícipios. Com esta divisão, obteve-se 2 Brasis: NN (formado por: AC,
AP, PA, AL, SE, BA, PI, CE, MA, PB, PE, RN, RR, AM) e SSO (formado por: ES, MS, MT, RJ,
RO, GO, MG, PR, RS, SC, SP, TO). Com esta categorização se obteve com 4 nós um acerto de
percentual global de 100%.
E, por fim, no Gráfico 31 - Árvore Classificatória - 2Brasis agrupados por similaridade de
"variabilidade", também se formaram dois grupos, contudo, o critério foi por similaridade dos
índices de variabilidade entre os dados de Gestão Fiscal e Desenvolvimento dos Munícipios das
UFs. Como resultado, obtiveram-se os seguintes grupos: AA (BA, PR, RS, SP, MG) e BB (AC,
AP, RR, RO, AL, SE, AM, MS, ES, RJ, CE, MT, TO, PA, RN, PE, MA, PI, PB, GO, SC). Por
meio da análise deste agrupamento obteve-se por meio de 2 nós 100% de acerto de percentual
global, e o indicador IFGF foi variável que possibilitou esta distinção dos grupos.
92
13.1 Árvore de decisão. - Região_1 IFGF_1, ReP_1, Pes_1, Inv_1, Liq_1, CD_1, EeR_1,
Edu_1, H6i_1, R1i_1, T1_2i_1, S1_1i_1, E2_4i_1
Variável dependente: Região_1 e Variáveis independentes: IFGF_1, ReP_1, Pes_1, Inv_1, Liq_1, CD_1,
EeR_1, Edu_1, H6i_1, R1i_1, T1_2i_1, S1_1i_1, E2_4i_1
Gráfico 30 - Árvore Classificatória - Regiões do Brasil
93
Risco
Estimativas Modelo padrão
,192 ,077
Método de crescimento: CHAID
Variável dependente: Região_1
Posto
Observado Previsto
Centro-Oeste Nordeste Norte Sudeste Sul Porcentagem
Correta
Centro-Oeste 3 0 0 0 0 100,0%
Nordeste 0 8 1 0 0 88,9%
Norte 0 0 7 0 0 100,0%
Sudeste 2 0 0 0 2 0,0%
Sul 0 0 0 0 3 100,0%
Porcentagem global 19,2% 30,8% 30,8% 0,0% 19,2% 80,8%
Método de crescimento: CHAID
Variável dependente: Região_1
94
13.2 Árvore de decisão.- BrasisM_1 pelas variáveis: IFGF_1, ReP_1, Pes_1, Inv_1, Liq_1,
CD_1, EeR_1, Edu_1, H6i_1, R1i_1, T1_2i_1, S1_1i_1, E2_4i_1.
Variável dependente: BrasisM_1 – Variáveis independentes: IFGF_1, ReP_1, Pes_1, Inv_1, Liq_1,
CD_1, EeR_1, Edu_1, H6i_1, R1i_1, T1_2i_1, S1_1i_1, E2_4i_1
Gráfico 31 - Árvore Classificatória - 2Brasis agrupados pela similaridade das médias
95
Risco
Estimativas Modelo padrão
,000 ,000
Método de crescimento: CHAID
Variável dependente: BrasisM_1
Posto
Observado Previsto
NN SSO Porcentagem
Correta
NN 14 0 100,0%
SSO 0 12 100,0%
Porcentagem global 53,8% 46,2% 100,0%
Método de crescimento: CHAID
Variável dependente: BrasisM_1
96
13.3 Árvore de decisão.- BrasisV_1 pelas variáveis: IFGF_3, ReP_3, Pes_3, Inv_3, Liq_3, CD_3,
EeR_3, Edu_3, H6i_3, R1i_3, T1_2i_3, S1_1i_3, E2_4i_3.
Gráfico 32 - Árvore Classificatória - 2Brasis agrupados por similaridade de "variabilidade"
Risco
Estimativas Modelo padrão
,000 ,000
Método de crescimento: CHAID
Variável dependente: BrasisV_1
Posto
Observado Previsto
AA BB Porcentagem
Correta
AA 5 0 100,0%
BB 0 21 100,0%
Porcentagem global 19,2% 80,8% 100,0%
Método de crescimento: CHAID
Variável dependente: BrasisV_1
97
REFERÊNCIAS
FIRJAN. Anexo Metodológico do IFGF. Disponível em: http://www.firjan.org.br/IFGF/download/anexo_metodologico_IFGF.pdf . Acesso em: 05/03/13 IBGE. Divisão Político-Administrativa. Disponível em: http://www.ngb.ibge.gov.br/Default.aspx?pagina=divisao . Acesso em 14/04/13. INFONET. Índice FIRJAN de Gestão Fiscal dos Municípios Sergipanos. Disponível em: http://www.infonet.com.br/economia/ler.asp?id=125792 . Acesso em: 05/03/13.