Post on 14-Jul-2015
LOCALIZAÇÃO
DE
NOVAS EMPRESAS EM
PORTUGAL CONTINENTAL
EM 2010
2
Localização de novas empresas em Portugal Continental em 2010
ÍNDICE
1. INTRODUÇÃO .................................................................................................................................. 3
1.1. ENQUADRAMENTO ............................................................................................................................... 3 1.2. METODOLOGIA ..................................................................................................................................... 3
2. ANÁLISE EXPLORATÓRIA ............................................................................................................ 4
2.1. APRESENTAÇÃO DOS DADOS ................................................................................................................ 4 2.2. CARTOGRAFIA....................................................................................................................................4 2.3. TÉCNICAS UNIVARIADAS ..................................................................................................................... 5
2.3.1 Medidas de tendência central e dispersão ...................................................................................... 6 2.3.2 Medidas de localização ................................................................................................................... 7 2.3.3 Medidas de especialização ............................................................................................................ 10 2.3.4 Medidas de correlação e associação espacial .............................................................................. 11 2.3.5 Medidas de variação discreta ....................................................................................................... 13 2.3.6 Análise shift-share ........................................................................................................................ 15
2.4.. TÉCNICAS MULTIVARIADAS ............................................................................................................... 15 2.4.1. Métodos Factoriais ................................................................................................................... 16 2.4.1.1. Análise em Componentes Principais (ACP) ............................................................................. 16 2.4.2. Método de Classificação Hierárquica e Não Hierárquica ....................................................... 19 2.4.2.1. Classificação Hierárquica ........................................................................................................ 19 2.4.2.2. Classificação Não Hierárquica – Método K-Means ................................................................. 20
3. ANÁLISE ECONOMÉTRICA ......................................................................................................... 22
3.1. ESCOLHA DAS VARIÁVEIS ................................................................................................................... 22 3.2. O MODELO ECONOMÉTRICO ............................................................................................................... 24 3.3. ANÁLISE DOS RESULTADOS ECONOMÉTRICOS .................................................................................... 25
4. POSSIBILIDADES DE INVESTIGAÇÕES FUTURAS .................................................................. 30
5. BIBLIOGRAFIA .............................................................................................................................. 30
3
Localização de novas empresas em Portugal Continental em 2010
1. INTRODUÇÃO
1.1. Enquadramento
Este trabalho foi elaborado no âmbito da disciplina de Métodos Quantitativos da
Análise Espacial, do Mestrado de Economia e Gestão das Cidades da Faculdade de
Economia da Universidade do Porto.
Pretende-se utilizar as técnicas de análise espacial para estudar a localização de empresas
no Continente português no ano de 2010.
1.2. Metodologia
No primeiro ponto utilizaram-se as técnicas de análise exploratória, onde a variável
nascimento de empresas será caracterizada através de padrões de localização e
especialização, e será realizado um estudo para ver a variação discreta do ano de 2004 para o
ano de 2010 com recurso à análise shift-share.
No segundo ponto faremos a caracterização do surgimento de novas empresas
recorrendo a várias variáveis, com o objectivo de sabermos se é possível identificar padrões
de correlação e associação entre as variáveis escolhidas, de forma a representa-las num novo
conjunto de variáveis (componentes) que resumam e deêm relevância às variáveis originais.
Finalmente na terceira parte, faz-se análise econométrica / confirmatória,
desenvolvendo-se um modelo de regessão linear e utilizando outros autorregressivos para
ver a autocorrelação entre regiões, saber se existe depência ou não.
O estudo foi elaborado com recurso a ferrrametas informáticas tais como:
ArcExplorer, Excel; Excel Add-In de Medidas de Localização e Especialização, SPSS
Statistics e MatLab (com scripts adequados à análise espacial).
4
Localização de novas empresas em Portugal Continental em 2010
2. ANÁLISE EXPLORATÓRIA
No segunda parte concentramo-nos na descrição e caracterização da nossa variável
principal o nascimento de empresas em Portugal Continental em 2010 através de técnicas
univariadas e posteriormente de técnicas multivariadas.
2.1.Apresentação dos dados
A variável principal do estudo é o nascimento de empresas em Portugal Continental
em 2010. Recolheram-se dados referentes ao ano de 2010 e 2004, todos eles disponíveis no
site do Instituto Nacional de Estatistica (www.ine.pt).
As unidades geográficas do estudo, são numa primeira fase as NUTs II e numa fase
posterior as NUTs III ambas apenas de Portugal Continental. Todos os dados recolhidos são
quantitativos, mas foram escolhidas diversas unidades de medida.
2.2. Cartografia
5
Localização de novas empresas em Portugal Continental em 2010
Elaborou-se a cartografia com o objectivo de visualmente ter uma melhor percepção da criação de empresas em Portugal continental em 2010 e a evolução que existiu de 2004 para 2010 considerando para o calculo desta variação apenas os valores de nascimentos de empresas em cada um dos referidos anos.
Observando a cartografia podemos ver que as NUTs do Norte e Lisboa são as que apresentam maior número de nascimento de empresas com 42863 e 44679 respectivamente, num nível intermédio temos a NUT do Centro com 26835 empresas criadas e por fim temos a NUT do Alentejo e a do Algarve com fraco número de criação de empresas tendo a primeira região criado 8988 empresas e a segunda 7520 num total de 130885 constituídas em Portugal continental no ano de 2010.
Analisando agora o mapa de variação percentual do número nascimento de empresas, constatamos que em todas as regiões essa variação é negativa, ou seja em qualquer região do continente foram criadas mais empresas em 2004 que em 2010. As NUTs com maior diminuição foram Lisboa e Alentejo ambas com -7,46% . A NUT centro teve uma variação intermédia situando-se a quebra nos -3,03%, as regiões que tiveram uma variação menos acentuada foram o Norte (-1,41%) e o Algarve (-0,24%), com valores bastante inferiores aos -4,24% de média em Portugal Continental.
2.3 Técnicas Univariadas
Nas técnicas univariadas é importante fazer a distinção entre a análise de estruturas
espaciais e análise de dinâmicas espaciais. A análise de estruturas espaciais refere-se
exclusivamente a um momento do tempo e vai ter em atenção os padrões espaciais de
localização e de especialização da variável em análise nesse momento, a segunda envolve
dois momento de tempo diferentes, no caso concreto 2004 e 2010 e mede as tendências de
variação desses padrões e os motivos dessas variações (variação discreta e método shift-
share). Será ainda realizada uma referência aos resultados obtidos na utilização das medidas
de tendência central e dispersão e na utilização das técnicas de correlação e associação
espacial.
6
Localização de novas empresas em Portugal Continental em 2010
2.3.1 Medidas de tendência central e dispersão
Statistics
Criação de empresas
NUTS II 2004 Criação de empresas
NUTSII 2010
N Valid 5 5
Missing 0 0
Mean 27336,20 26177,00
Median 27673,00 26835,00
Mode 7538a 7520a
Std. Deviation 18720,558 17781,486
Variance 350459281,700 316181233,500
Minimum 7538 7520
Maximum 48281 44679
Percentiles 25 8625,50 8254,00
50 27673,00 26835,00
75 45878,50 43771,00
a. Multiple modes exist. The smallest value is shown
Relativamente à variável Criação de Empresas em 2010 nas 5 NUTS II de Portugal Continental e depois de analisado o quadro podemos observar que:
-‐ Em média foram constituídas em média 26177 empresas;
-‐ Ordenando as observações de forma crescente, a observação que se encontra no primeiro quartil (25%) da amostra é cerca de 8254 sociedades criadas, no segundo (50%) de 26835 novas empresas e no terceiro (75%) é de 43771 novos nascimentos;
-‐ O número de sociedades constituídas mais frequente é o 7520, apesar de existirem outras modas (a.), esta é a que apresenta o valor mais baixo;
7
Localização de novas empresas em Portugal Continental em 2010
-‐ Existe um desvio padrão em relação à média de 17781 empresas, um intervalo de variação entre o máximo e mínimo de novas sociedades de 37159 e um coeficiente de variação (Desvio-‐padrão/Média) de 0,68;
Constata-‐se ainda que, relativamente a 2004, a dispersão das observações diminui, sendo no ano de 2004 de 40743 sociedades, contudo o coeficiente de variação manteve-‐se idêntico nos 0,68.
2.3.2 Medidas de localização
Índices de concentração
Através dos Índices de Concentração conseguimos saber, para cada um dos sectores, se as novas empresas criadas em 2010 estão homogeneamente distribuídas por Portugal Continental ou se, pelo contrário, existe concentração espacial. Os índices de Rogers e de Herfindahl dizem-nos que quanto maiores forem os valores (mais próximos de 1), maior será a concentração espacial, já o índice de Theil é uma medida inversa da concentração, pelo que quanto menor for o seu valor (quanto mais próximo de 0) maior é a concentração espacial.
Os resultados obtidos são consistentes entre si quando analisados os índices atrás referidos. Desta forma podemos agrupar os sectores em três grupos:
-Grupo de fraca concentração onde temos a criação de novas empresas dos sectores agricultura, produção animal, caça e silvicultura e pesca, construção, comércio por grosso e a retalho; reparação de veículos automóveis e motociclos, transportes e armazenagem; alojamento, restauração e similares e outras atividades de serviços, o que seria de esperar pois são sectores que se podem espalhar por todo o território nacional, não existindo especificidades geográficas em cada um deles excepto no sector das pescas que
A B C D E F G H I J K L M N O+P
Agricultura, produção
animal, caça e silvicultura
e Pesca
Indústrias extractivas
Indústrias transformad
oras
Eletricidade, gás, vapor, água quente e fria e ar frio e Captação, tratamento e distribuição de água;
saneamento, gestão de resíduos e
despoluição
Construção
Comércio por grosso e a retalho; reparação de veículos automóveis e motociclos
Transportes e
armazenagem
Alojamento, restauração e similares
Atividades de
informação e de
comunicação
Atividades imobiliárias
Atividades de consultoria, científicas, técnicas e similares e Atividades
administrativas e dos
serviços de apoio
Educação
Atividades de saúde humana e
apoio social
Atividades artísticas,
de espetáculo
s, desportivas
e recreativas
Outras atividades
de serviços
Rogers CR 3,580 3,839 4,123 3,887 3,699 3,855 3,840 3,706 4,222 3,955 3,973 3,885 3,894 3,908 3,860Rogers normalizado CR* 0,193 0,280 0,374 0,296 0,233 0,285 0,280 0,235 0,407 0,318 0,324 0,295 0,298 0,303 0,287Herfindahl CH 0,236 0,282 0,352 0,284 0,253 0,277 0,277 0,253 0,371 0,293 0,300 0,284 0,285 0,287 0,278Herfindahl normalizado CH* 0,045 0,102 0,189 0,105 0,066 0,096 0,096 0,066 0,213 0,117 0,126 0,105 0,106 0,109 0,098Theil CT 1,511 1,402 1,248 1,363 1,461 1,398 1,396 1,474 1,192 1,360 1,349 1,380 1,371 1,384 1,410Theil normalizado CT* 0,939 0,871 0,775 0,847 0,908 0,869 0,868 0,916 0,741 0,845 0,838 0,857 0,852 0,860 0,876Coeficiente de localização CL 0,305 0,244 0,192 0,060 0,080 0,063 0,013 0,094 0,186 0,086 0,087 0,116 0,045 0,070 0,071Coeficiente de Gini CG 0,409 0,317 0,235 0,072 0,112 0,073 0,017 0,121 0,212 0,104 0,093 0,123 0,054 0,084 0,079
Índices de Concentração
8
Localização de novas empresas em Portugal Continental em 2010
além de ter uma extensa costa está também associado às atividades do sector agrícola não extrativa.
-Grupo de maior concentração em que se destacam novas empresas dos sectores das indústrias transformadoras e das atividades de informação e de comunicação, resultado também previsível dado a necessidade de algumas especificidades como vias de comunicação, densidade populacional, equipamentos de serviços de informação e situação geográfica estratégica para a distribuição dos seus bens e serviços.
-Grupo de concentração intermédia é composto pelos restantes sectores, todos eles próximos do grupo de maior concentração, contudo não foram inseridos nesse grupo para destacar os dois sectores que possuíam os maiores valores nos índices de Rogers e Herfindahl e os menores no índice de Theil.
Relativamente aos três índices analisados é importante referir que mesmo os sectores inseridos no grupo de maior concentração não possuem valores consistentes para dizermos que são muito concentrados, foi decidido escolher três grupos para se poderem comparar os sectores entre si.
Os resultados obtidos não fornecem informações sobre a unidade geográfica em que poderá existir concentração, essa resposta está na análise aos Quocientes de Localização.
Analisemos agora os Índices de Gini, Curvas de Localização e Coeficientes de Localização, medidas de concentração relativa que têm a atividade padrão como referência, neste caso concreto será a totalidade dos sectores.
- O Índice de Gini é um indicador do grau de concentração espacial e pode ser visto através das curvas de localização (em ficheiro anexo), que evidenciam graficamente a maior ou menor similitude dos perfis de concentração de cada sector com perfil de concentração de cada sector com perfil de concentração geral. Os sectores que apresentam maior grau de concentração em termos relativos (embora este não seja muito elevado) são o Agricultura, produção animal, caça, silvicultura e Pesca e das industrias extrativas, parece razoável que assim seja pois estão fortemente dependentes da localização dos recursos naturais.
- No que respeita aos Coeficientes de Localização, são novamente os sectores da Agricultura, produção animal, caça, silvicultura e Pesca e das industrias extrativas que se destacam, o que está em concordância com os resultados anteriormente analisados. Quanto aos restantes sectores (e mesmo os dois anteriores podem ser incluídos nesta conclusão,
9
Localização de novas empresas em Portugal Continental em 2010
dado o seus valores não serem elevados) não apresentam uma grande diferenciação entre perfis de concentração no continente e o de cada uma das atividades das sociedades, pois os seu valores são próximos de 0.
Quocientes de Localização
Quanto maior for o valor dos Quocientes de Localização, maior a concentração
espacial relativa.
Os sectores que mais se destacam, mesmo os valores não sendo muito elevados para todos os sectores, são o da Agricultura, produção animal, caça, silvicultura e pesca e das industrias extrativas o que está de acordo com os dados fornecidos pelo Índice de Gini. Sendo que o Sector Agricultura, produção animal, caça, silvicultura e pesca apresentam os maiores Quocientes de Localização na região do Alentejo e o sector das Industrias extractivas na região Centro.
De salientar ainda que nos casos em que o índice apresenta um valor superior a 1 podemos concluir que a unidade geográfica é relativamente mais importante no contexto nacional em termos de sector, do que em termos gerais de todos os sectores.
Por fim fazendo uma breve análise aos restantes sectores constata-se que as novas industrias transformadoras são especialmente mais concentras no Norte; as de eletricidade, gás, vapor, água quente e fria e ar frio e captação, tratamento e distribuição de água;
Quocientes de Localização
A B C D E F G H I J K L M N O+P
Agricultura, produção
animal, caça e
silvicultura e Pesca
Indústrias
extractivas
Indústrias
transformadora
s
Eletricidade, gás, vapor,
água quente e
fria e ar frio e Captação, tratamento
e distribuição de água;
saneamento, gestão de resíduos e
despoluição
Construção
Comércio por
grosso e a retalho; reparaçã
o de veículos
automóveis e
motociclos
Transportes e armazenagem
Alojamento,
restauração e
similares
Atividades de
informação e de
comunicação
Atividades imobiliária
s
Atividades de
consultoria,
científicas,
técnicas e
similares e
Atividades
administrativas e
dos serviços de apoio
Educação
Atividades de saúde humana e
apoio social
Atividades artísticas,
de espetácul
os, desportiva
s e recreativa
s
Outras atividades
de serviços
Norte 0,745 1,085 1,587 1,085 0,997 1,145 1,041 1,105 0,818 0,908 0,851 1,221 1,113 0,831 0,868
Centro 1,212 1,733 0,987 1,155 1,220 1,075 0,993 1,040 0,674 0,877 0,903 1,171 1,038 0,944 0,864
Lisboa 0,350 0,284 0,569 0,915 0,786 0,834 0,982 0,724 1,546 1,193 1,254 0,713 0,934 1,202 1,160
Alentejo 4,392 1,845 0,764 0,845 0,921 0,909 0,960 1,335 0,457 0,554 0,830 1,132 0,832 0,951 1,006
Algarve 1,421 1,124 0,553 0,656 1,603 1,003 0,943 1,489 0,620 1,358 0,890 0,676 0,819 1,020 1,285
10
Localização de novas empresas em Portugal Continental em 2010
saneamento, gestão de resíduos e despoluição no Norte e Centro; as da Construção no Algarve e Centro, o Comércio por grosso e a retalho e reparação de veículos automóveis e motociclos no Norte e Centro; transportes e armazenagem no Norte; Alojamento, restauração e similares no Algarve; as Atividades de informação e de comunicação em Lisboa; as Atividades imobiliárias em Lisboa e Algarve; as Atividades de consultoria, científicas, técnicas e similares e Atividades administrativas e dos serviços de apoio em Lisboa; a educação no Norte, Centro e Alentejo; as Atividades de saúde humana e apoio social têm quocientes de Localização muito próximos nas cinco regiões; as Atividades artísticas, de espetáculos, desportivas e recreativas na Região de Lisboa e no Algarve e por fim as outras atividades de serviços no Algarve, Lisboa e Alentejo.
2.3.3 Medidas de especialização
Índices de especialização Índices de Especialização
U.G.
Rogers Herfindahl Theil
ER ER* EH EH* ET ET*
Norte 12,392 0,549 0,171 0,112 2,096 0,774
Centro 12,413 0,552 0,178 0,119 2,081 0,768
Lisboa 12,791 0,599 0,261 0,208 1,870 0,690
Alentejo 12,302 0,538 0,161 0,101 2,124 0,784
Algarve 12,383 0,548 0,174 0,115 2,092 0,773
No quadro observamos a consistência dos resultados em que a região de Lisboa é a NUT que apresenta o maior grau de especialização empresarial das novas sociedades constituídas. As restantes regiões têm um grau de especialização idêntico e um pouco mais baixo que a NUT II Lisboa.
Faremos agora uma análise na perspectiva da unidade geográfica, ou seja pretendemos saber em que sectores se especializaram ou não cada uma das NUTS II, para isso utilizaremos os Quocientes de Especialização.
11
Localização de novas empresas em Portugal Continental em 2010
Relativamente às regiões do Norte e do Centro as novas empresas são especializadas no sector
das industrias transformadoras; no respeitante a Lisboa a especialização das novas sociedades centra-se nas atividades de informação e comunicação; o Alentejo tem a sua especialização sobretudo na agricultura, produção animal, caça, silvicultura e pesca, mas também tem um bom quociente nas industrias extrativas; finalmente o Algarve tem a sua especialização de novas empresas nos sectores da construção e alojamento, restauração e similares.
Por outro lado, analisando em que sectores as NUTS são menos especializadas relativamente, temos o norte com o sector da agricultura, produção animal, caça, silvicultura e pesca, o Centro com as atividades de informação e de comunicação, Lisboa com as industrias extrativas e com a agricultura, produção animal, caça, silvicultura e pesca, o Alentejo com as atividades de informação e comunicação e o Algarve com as industrias transformadoras.
2.3.4 Medidas de correlação e associação espacial
Coeficientes de Associação Sectorial
Estes coeficientes medem a intensidade da similitude nos perfis de especialização de
duas unidades geográficas. Medem apenas a intensidade e não o sentido da relação entre unidades geográficas. Em termos de análise temos que quanto mais próximo do zero está o coeficiente maior é a similitude de perfis.
Analisando concretamente os valores obtidos, concluímos que embora os valores sejam todos relativamente baixos o Norte tem maiores similitudes no perfil de especialização com o Centro, o Centro
com o Norte, Lisboa tem os valores mais elevados por isso considera-‐se a região mais afastada em termos de similitudes de especialização, o mesmo acontecendo com a região do Alentejo, o Algarve apresenta uma similitude de perfil de especialização idêntico ao do Centro.
Quocientes de EspecializaçãoA B C D E F G H I J K L M N O+P
Agricultura, produção
animal, caça e silvicultura
e Pesca
Indústrias extractivas
Indústrias transformador
as
Eletricidade, gás, vapor,
água quente e fria e ar frio e Captação, tratamento e distribuição
de água; saneamento,
gestão de resíduos e
despoluição
Construção
Comércio por grosso e a
retalho; reparação de
veículos automóveis e
motociclos
Transportes e armazenagemAlojamento,
restauração e similares
Atividades de informação e
de comunicação
Atividades imobiliárias
Atividades de consultoria, científicas, técnicas e similares e Atividades
administrativas e dos
serviços de apoio
Educação
Atividades de saúde
humana e apoio social
Atividades artísticas, de espetáculos, desportivas e recreativas
Outras atividades de
serviços
Norte 0,745 1,085 1,587 1,085 0,997 1,145 1,041 1,105 0,818 0,908 0,851 1,221 1,113 0,831 0,868Centro 1,212 1,733 0,987 1,155 1,220 1,075 0,993 1,040 0,674 0,877 0,903 1,171 1,038 0,944 0,864Lisboa 0,350 0,284 0,569 0,915 0,786 0,834 0,982 0,724 1,546 1,193 1,254 0,713 0,934 1,202 1,160
Alentejo 4,392 1,845 0,764 0,845 0,921 0,909 0,960 1,335 0,457 0,554 0,830 1,132 0,832 0,951 1,006Algarve 1,421 1,124 0,553 0,656 1,603 1,003 0,943 1,489 0,620 1,358 0,890 0,676 0,819 1,020 1,285
Coeficientes de Associação SectorialNorte Centro Lisboa Alentejo Algarve
Norte 0,000 0,049 0,191 0,119 0,128Centro 0,049 0,000 0,171 0,109 0,089Lisboa 0,191 0,171 0,000 0,209 0,168Alentejo 0,119 0,109 0,209 0,000 0,123Algarve 0,128 0,089 0,168 0,123 0,000
12
Localização de novas empresas em Portugal Continental em 2010
Coeficientes de Associação Geográfica
Os Coeficientes de Associação Geográfica medem a similitude dos padrões de concentração dos sectores empresariais. Mais uma vez medem apenas a intensidade dessa relação. Quanto maior for coeficiente maior a dissemelhança de perfis.
Identificamos os maiores coeficientes (acima de 0,3) no Sector da agricultura, produção animal, caça, silvicultura e pesca em relação a quase todos os outros, ou seja este é o sector que apresenta maior dissemelhança entre os perfis de concentração geográfica relativamente à grande maioria dos restantes sectores. O sector que tem maior similitude entre perfis de concentração geográfica com a maioria dos restantes é o sector dos transportes e armazenagem que apresenta o maior número de coeficientes inferiores a 0,1.
Coeficiente de Correlação de Bravais-Pearson
Coeficientes de Associação GeográficaA B C D E F G H I J K L M N O+P
Agricultura, produção
animal, caça e
silvicultura e Pesca
Indústrias extractivas
Indústrias transformad
oras
Eletricidade, gás, vapor, água quente e fria e ar frio e Captação, tratamento e distribuição de água;
saneamento, gestão de resíduos e
despoluição
Construção
Comércio por grosso e
a retalho; reparação de
veículos automóveis e motociclos
Transportes e
armazenagem
Alojamento,
restauração e
similares
Atividades de
informação e de
comunicação
Atividades imobiliária
s
Atividades de
consultoria, científicas, técnicas e similares e Atividades administrativas e dos
serviços de apoio
Educação
Atividades de saúde humana e
apoio social
Atividades artísticas,
de espetáculo
s, desportiva
s e recreativas
Outras atividades
de serviços
Agricultura, produção animal, caça - 0,218 0,350 0,304 0,243 0,296 0,312 0,249 0,431 0,341 0,343 0,279 0,319 0,319 0,316Indústrias extractivas 0,218 - 0,261 0,215 0,199 0,207 0,238 0,178 0,430 0,323 0,331 0,191 0,231 0,313 0,308Indústrias transformadoras 0,350 0,261 - 0,164 0,193 0,144 0,178 0,157 0,337 0,259 0,258 0,120 0,155 0,256 0,260Eletricidade, gás, vapor, água quen 0,304 0,215 0,164 - 0,073 0,044 0,048 0,089 0,215 0,135 0,129 0,069 0,025 0,126 0,131Construção 0,243 0,199 0,193 0,073 - 0,065 0,084 0,064 0,259 0,139 0,160 0,088 0,088 0,144 0,133Comércio por grosso e a retalho; re 0,296 0,207 0,144 0,044 0,065 - 0,054 0,058 0,243 0,143 0,143 0,060 0,034 0,130 0,134Transportes e armazenagem 0,312 0,238 0,178 0,048 0,084 0,054 - 0,088 0,192 0,096 0,093 0,107 0,033 0,079 0,083Alojamento, restauração e similares 0,249 0,178 0,157 0,089 0,064 0,058 0,088 - 0,280 0,160 0,181 0,065 0,074 0,163 0,148Atividades de informação e de comun 0,431 0,430 0,337 0,215 0,259 0,243 0,192 0,280 - 0,120 0,100 0,284 0,209 0,117 0,132Atividades imobiliárias 0,341 0,323 0,259 0,135 0,139 0,143 0,096 0,160 0,120 - 0,045 0,203 0,119 0,045 0,032Atividades de consultoria, científi 0,343 0,331 0,258 0,129 0,160 0,143 0,093 0,181 0,100 0,045 - 0,197 0,113 0,024 0,040Educação 0,279 0,191 0,120 0,069 0,088 0,060 0,107 0,065 0,284 0,203 0,197 - 0,084 0,187 0,187Atividades de saúde humana e apoio 0,319 0,231 0,155 0,025 0,088 0,034 0,033 0,074 0,209 0,119 0,113 0,084 - 0,111 0,116Atividades artísticas, de espetácul 0,319 0,313 0,256 0,126 0,144 0,130 0,079 0,163 0,117 0,045 0,024 0,187 0,111 - 0,031Outras atividades de serviços 0,316 0,308 0,260 0,131 0,133 0,134 0,083 0,148 0,132 0,032 0,040 0,187 0,116 0,031 -
13
Localização de novas empresas em Portugal Continental em 2010
Este coeficiente diz-nos qual o sentido da relação entre os vários sectores de atividade. Do que se pode observar, constatamos que todos os sectores estão positivamente correlacionados entre si, os valores da correlação de Pearson são todos muito próximos de 1, o que significa que o número de empresas de um sector aumenta quando o número de empresas de outro sector aumenta, contudo não é possível estabelecer relações de causalidade a partir dos coeficientes de correlação dado serem todos muito próximos. Estes dados poderão indicar a existência do fenómeno de economias de aglomeração, ou seja tirar vantagens da concentração espacial por exemplo na diminuição de custo de transportes de matérias primas e/ou intermédias e/ou acabadas e troca de conhecimentos e tecnologia.
2.3.5 Medidas de variação discreta
Medidas de Variação Absolutas e Relativas
A tendência geral indica uma diminuição de nascimentos de empresas de 2004 para 2010, com cerca de menos 5616 empresas criadas, ou em termos relativos menos 4,109%.
Observando as tabelas destacamos quatro sectores que contrariam a tendência geral, apresentando uma variação positiva, são eles o sector da eletricidade, gás, vapor, água quente e fria, ar frio, captação, tratamento e distribuição de água, saneamento, gestão de resíduos e despoluição com mais 59 novas empresas e variação relativa de 46,457%; o sector das atividades de consultoria, científicas, técnicas e similares e atividades administrativas e dos serviços de apoio com a criação de mais 11005 sociedades, em termos percentuais 28,666%; a educação com mais 1296 nascimentos de empresas (13,771%) e finalmente o sector das atividades de saúde humana e apoio social com 1019 novas
Variações absolutasA B C D E F G H I J K L M N O+P
Agricultura, produção
animal, caça e silvicultura e
Pesca
Indústrias extractivas
Indústrias transformador
as
Eletricidade, gás, vapor,
água quente e fria e ar frio e
Captação, tratamento e
distribuição de água;
saneamento, gestão de resíduos e
despoluição
Construção
Comércio por grosso e a
retalho; reparação de
veículos automóveis e
motociclos
Transportes e armazenagem
Alojamento, restauração e
similares
Atividades de informação e
de comunicação
Atividades imobiliárias
Atividades de consultoria, científicas, técnicas e similares e Atividades
administrativas e dos
serviços de apoio
Educação
Atividades de saúde humana e
apoio social
Atividades artísticas, de espetáculos, desportivas e recreativas
Outras atividades
de serviços
Norte -435 -12 -744 21 -941 -1383 -596 -234 -32 -34 2890 799 668 -26 -554 -613Centro -276 -13 -459 12 -1330 -946 -413 -351 -72 -7 2779 309 471 -10 -532 -838Lisboa -121 -10 -331 20 -1224 -1757 -143 -122 -257 -54 3573 73 -225 -410 -2614 -3602
Alentejo -379 -7 -87 1 -298 -529 -139 -105 -19 -42 1048 134 74 -1 -196 -545Algarve -37 1 -51 5 -166 -177 -20 -75 1 -126 715 -19 31 -23 -77 -18
Total -1248 -41 -1672 59 -3959 -4792 -1311 -887 -379 -263 11005 1296 1019 -470 -3973 -5616
U.G. Total
Variações relativasA B C D E F G H I J K L M N O+P
Agricultura, produção
animal, caça e silvicultura e
Pesca
Indústrias extractivas
Indústrias transformador
as
Eletricidade, gás, vapor,
água quente e fria e ar frio e
Captação, tratamento e
distribuição de água;
saneamento, gestão de resíduos e despoluição
Construção
Comércio por grosso e a
retalho; reparação de
veículos automóveis e
motociclos
Transportes e armazenagem
Alojamento, restauração e
similares
Atividades de informação e
de comunicação
Atividades imobiliárias
Atividades de consultoria, científicas, técnicas e similares e Atividades
administrativas e dos
serviços de apoio
Educação
Atividades de saúde
humana e apoio social
Atividades artísticas, de espetáculos, desportivas e recreativas
Outras atividades de
serviços
Norte -34,524 -35,294 -24,514 46,667 -26,016 -14,366 -62,019 -6,765 -5,808 -4,462 26,609 22,986 25,555 -2,562 -25,660 -1,410Centro -24,731 -37,143 -33,975 37,500 -39,349 -16,344 -65,452 -15,600 -21,176 -1,566 43,722 13,691 32,595 -1,403 -34,726 -3,028Lisboa -23,048 -62,500 -27,885 52,632 -35,748 -21,930 -28,486 -5,247 -20,078 -5,138 20,366 2,885 -7,267 -21,568 -53,897 -7,460
Alentejo -26,709 -46,667 -26,935 10,000 -36,034 -27,424 -65,877 -11,194 -23,457 -30,657 57,551 18,768 16,408 -0,412 -32,997 -5,611Algarve -11,821 33,333 -26,702 250,000 -18,024 -12,266 -25,641 -8,961 1,471 -39,748 39,546 -4,378 7,888 -9,746 -15,587 -0,239
Total -26,937 -39,806 -27,468 46,457 -32,533 -17,881 -55,015 -9,043 -16,336 -9,690 28,666 13,771 12,739 -11,441 -41,261 -4,109
U.G. Total
14
Localização de novas empresas em Portugal Continental em 2010
empresas o que equivale a uma variação em termos de percentagem de 12,739. Estas variações positivas poderão estar associadas ao desenvolvimento tecnológico, novas energias renováveis, investimento na investigação e na modernização do parque escolar e serviços de saúde por parte do governo e também com envelhecimento da população no caso dos serviços de apoio social.
Analisando agora o que aconteceu nas regiões vemos que a tendência continua negativa sendo que Lisboa apresenta a maior diferença negativa, tanto em termos absolutos como percentuais e o Algarve a menor diferença, sendo uma perda quase negligenciável, muito próxima do 0, o que nos diz que a criação de novas empresas no Algarve no ano de 2010 foi muito semelhante em termos de número, havendo algumas diferenças no tipo de sectores escolhidos para a abertura de novas empresas. Todos os resultados apresentados comparam o ano de 2010 com o de 2004.
Coeficientes de Reestruturação Sectorial e Coeficientes de Redistribuição
Geográfica
O Coeficiente de Redistribuição Sectorial relaciona as estruturas de produção de cada NUT II entre 2004 e 2010, de forma a avaliar as dinâmicas de mudança no grau de especialização sectorial. Através da análise feita ao primeiro quadro vemos que os valores são muito semelhantes e próximos de 0 para as cinco regiões, o que significa que no essencial respeitam a estrutura produtiva já existente, mantendo as novas empresas o padrão de especialização.
No que respeita ao Coeficiente de redistribuição geográfica, este relaciona a proporção
de cada uma das variáveis em cada uma das unidades geográficas de 2004 para 2010, como
medida de estabilidade dos padrões de concentração espacial. Mais uma vez os valores são
Coeficientes de Reestruturação SectorialU.G. CRSNorte 0,108Centro 0,145Lisboa 0,117Alentejo 0,157Algarve 0,101Total 0,120
Coeficientes de Redistribuição GeográficaA B C D E F G H I J K L M N O+P
Agricultura, produção
animal, caça e silvicultura
e Pesca
Indústrias extractivas
Indústrias transformado
ras
Eletricidade, gás, vapor, água quente e fria e ar frio e Captação, tratamento e distribuição de água;
saneamento, gestão de resíduos e
despoluição
Construção
Comércio por grosso e a
retalho; reparação de
veículos automóveis e
motociclos
Transportes e
armazenagem
Alojamento, restauração e similares
Atividades de informação e
de comunicação
Atividades imobiliárias
Atividades de consultoria, científicas, técnicas e similares e Atividades
administrativas e dos
serviços de apoio
Educação
Atividades de saúde
humana e apoio social
Atividades artísticas, de espetáculos, desportivas e
recreativas
Outras atividades de
serviços
CRG 0,028 0,075 0,021 0,035 0,045 0,023 0,146 0,019 0,036 0,051 0,034 0,033 0,071 0,053 0,108 0,013
Total
15
Localização de novas empresas em Portugal Continental em 2010
baixo e próximos de 0 concluindo-se que o padrão de localização permanece idêntico ao que
existia em 2004, havendo estabilidade do padrão de localização.
2.3.6 Análise shift-share
Com a análise shift-share decompomos os efeitos de variação discreta (entre 2004 e 2010) na estrutura regional-sectorial da variável nascimento de novas empresas
No que respeita à variação geral, ou seja à variação que ocorreria se cada NUT II tivesse crescido à taxa de variação do conjunto das NUTS II e sectores de atividade (variação homotética) observamos que a criação de novas empresas em Portugal Continental seria menor que em 2004. Mas cada Nut II e cada sector têm as suas especificidades, sendo que a criação de novas empresas está intimamente ligada a factores de dinamismo sectorial e de competitividade, o que está representado pela variação estrutural e diferencial respectivamente. Assim vemos que as causas desta diminuição de constituição de novas empresas deve-se na Região de Lisboa a factores de competitividade e nas restantes regiões a factores de dinamismo sectorial, pois é onde apresentam valores negativos.
2.4.Técnicas Multivariadas
Nas técnicas univariadas concentramo-nos na variável constituição de empresas por NUTII, agora nas técnicas multivariadas o objectivo é caracterizar o conjunto de empresas sediadas no Continente.
Análise Shift-Share clássica
Valor % Valor %Norte -613,00 -1786,36 1173,36 -364,66 -31,08 1538,01 131,08
Centro -838,00 -1137,04 299,04 -714,57 -238,96 1013,61 338,96Lisboa -3602,00 -1983,79 -1618,21 1737,03 -107,34 -3355,24 207,34
Alentejo -545,00 -399,09 -145,91 -509,68 349,32 363,78 -249,32Algarve -18,00 -309,72 291,72 -148,12 -50,77 439,84 150,77
Variação diferencialU.G. Variação efectiva
Variação geral
Variação líquida
Variação estrutural
Variáveis Unidade,de,Medida NaturezaPessoas&ao&serviço&das&empresas nº&de&Pessoas QuantitativaVolume&de&Négocio&das&empresas milhares&de&euros QuantitativaVAB&das&empresas milhares&de&euros QuantitativaRendibilidade&das&Vendas % QuantitativaProdutividade&aparente&do&trablho milhares&de&euros QuantitativaCustos&com&pessoal milhares&de&euros QuantitativaNúmero&de&empresas nº&de&empresas QuantitativaFormação&bruta&de&capital milhares&de&euros QuantitativaProdução&das&empresas milhares&de&euros QuantitativaResultado&Liquido&do&Exercicio milhares&de&euros QuantitativaTaxa&de&sobrevivência&das&empresas&nascidas&2&anos&antes % QuantitativaPeso&dos&custos&com&pessoal&no&VAB&das&empresas % Quantitativa
16
Localização de novas empresas em Portugal Continental em 2010
Para o efeito, foram recolhidos dados das Nuts III relativos a 12 variáveis que caracterizam as empresas localizadas em Portugal continental de diferentes pontos de vista.
As técnicas multivariadas usadas são importantes porque permitem a sintetização da informação e identificam relações existentes entre as variáveis através de métodos factoriais ou de redução de dados, agrupando unidades geográficas de acordo com as classes criadas no âmbito da aplicação dos métodos de classificação hierárquica e não hierárquica.
2.4.1. Métodos Factoriais
O recurso a métodos factoriais torna-se indispensável dado estarmos a analisar 12 variáveis com uma observação por cada NUT III de Portugal continental, o que originaria uma matriz muito grande com uma enorme quantidade de informação (28X12=336). Os métodos factoriais irão permitir sintetizar a informação facilitando a sua leitura e interpretação. Serão criadas novas variáveis (os factores ou componentes) que agregam várias variáveis originais de acordo com as tendências, estruturas e características em comum.
2.4.1.1.Análise em Componentes Principais (ACP)
O método factorial escolhido foi o da Análise em Componentes Principais (ACP) dado ser o método que melhor se adequa às variáveis recolhidas uma vez que estas são todas de natureza quantitativa.
Resultados obtidos através do SPSS Statistics após a importação de dados do Excel
Mean Std. Deviation Analysis NPessoal ao serviço (N.º) das Empresas 131892,571 226425,067 28Volume de negócios (1000€) das empresas
12331709,861 28705714,768 28
Valor acrescentado bruto (1000€) das Empresas
3046755,355 7103260,618 28
Rendibilidade das vendas % 8,694 2,461 28Produtividade aparente do trabalho € 3,783 0,434 28Custos com o pessoal 1000€ 1760653,778 3913746,597 28Nº de empresas 37863,964 52202,522 28FBC 1000€ 637857,673 1460420,868 28Produção (1000€) das Empresas 8437847,017 19535494,179 28Resultado líquido do exercício 1000€ 685128,581 2213348,952 28Taxa de sobrevivência (%) das Empresas nascidas 2 anos antes
52,443 4,484 28
Peso dos custos com pessoal no valor acrescentado bruto das Empresas
44,037 7,847 28
Descriptive Statistics
17
Localização de novas empresas em Portugal Continental em 2010
No quadro de Communalities na coluna Exctraction obtemos a proporção de variância explicada pelo conjunto de componentes principais retidas na análise. Os valores obtidos são próximos de 1 por isso não haverá necessidade de retirar ou adicionar factores à análise.
As colunas Extraction e Rotation Sums of squared Loadings do quadro acima fornecem-nos a informação sobre a percentagem da variância explicada pelas componentes principais. Sendo a extração das componentes principais feita por ordem decrescente da variância explicada e através da adopção do critério do valor próprio superior a 1 é possível identificar o número de
Initial ExtractionPessoal ao serviço (N.º) das Empresas 1,000 ,987Volume de negócios (1000€) das empresas
1,000 ,995
Valor acrescentado bruto (1000€) das Empresas
1,000 ,994
Rendibilidade das vendas % 1,000 ,818Produtividade aparente do trabalho € 1,000 ,612Custos com o pessoal 1000€ 1,000 ,995Nº de empresas 1,000 ,970FBC 1000€ 1,000 ,982Produção (1000€) das Empresas 1,000 ,995Resultado líquido do exercício 1000€ 1,000 ,979Taxa de sobrevivência (%) das Empresas nascidas 2 anos antes
1,000 ,840
Peso dos custos com pessoal no valor acrescentado bruto % das Empresas
1,000 ,811
Communalities
Extraction Method: Principal Component Analysis.
Total % of Variance Cumulative % Total% of
VarianceCumulati
ve % Total% of
VarianceCumulativ
e %1 8,776 73,136 73,136 8,776 73,136 73,136 8,063 67,189 67,189
2 1,128 9,399 82,535 1,128 9,399 82,535 1,792 14,937 82,126
3 1,072 8,930 91,465 1,072 8,930 91,465 1,121 9,339 91,465
4 ,749 6,244 97,710
5 ,217 1,811 99,521
6 ,049 ,408 99,929
7 ,006 ,053 99,982
8 ,001 ,010 99,992
9 ,001 ,005 99,997
10 ,000 ,002 99,998
11 ,000 ,001 100,000
12 4,379E-05 ,000 100,000
Component Initial EigenvaluesExtraction Sums of Squared
LoadingsRotation Sums of Squared
Loadings
18
Localização de novas empresas em Portugal Continental em 2010
componentes principais a partir do qual o contributo da retenção de mais uma componente é negligenciável. Assim o número de componentes a reter é 3, explicando estas 91,465% da variância total. O gráfico Scree Plot confirma a escolha atendendo ao critério do valor próprio superior a 1.
A Rotated Component Matrix é uma matriz de correlações entre as variáveis originais e as componentes principais retidas. Para conseguirmos interpretar o quadro anterior e as componentes principais que foram originadas temos que identificar as correlações de maior intensidade e o sentido dessas correlações.
O primeira componente principal (1) está positivamente correlacionado com maioria das variáveis, com o pessoal ao serviço das empresas, volume de negócios, VAB, custos com pessoal, número de empresas, formação bruta de capital, produção das empresas e resultado líquido do exercício, pelo que será uma componente de Dimensão Económica.
A segunda componente principal (2) tem uma correlação positiva com a rendibilidade das vendas e número de empresas e uma correlação negativa com a taxa de sobrevivência das empresas nascidas 2 anos antes, poderá indiciar uma componente de relação inversa entre rendibilidade das vendas e sobrevivência de empresas nascidas 2 anos antes.
A terceira componente principal correlaciona positivamente a produtividade aparente do trabalho e o peso dos custo do pessoal no VAB o que sugere uma componente de Produtividade do Trabalho.
1 2 3Pessoal ao serviço (N.º) das Empresas ,963 ,235 ,070Volume de negócios (1000€) das empresas
,974 ,215 -,028
Valor acrescentado bruto (1000€) das Empresas
,974 ,211 -,026
Rendibilidade das vendas % ,561 ,699 -,122Produtividade aparente do trabalho € ,415 -,317 ,582Custos com o pessoal 1000€ ,973 ,217 ,001Nº de empresas ,916 ,336 ,131FBC 1000€ ,968 ,210 -,041Produção (1000€) das Empresas ,974 ,214 -,031Resultado líquido do exercício 1000€ ,968 ,192 -,076Taxa de sobrevivência (%) das Empresas nascidas 2 anos antes
-,297 -,862 -,096
Peso dos custos com pessoal no valor acrescentado bruto % das Empresas
-,238 ,170 ,852
Rotated Component Matrixa
Component
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.a. Rotation converged in 7 iterations.
19
Localização de novas empresas em Portugal Continental em 2010
O quadro Component Score Coeficient Matrix dá-nos os coeficientes que permitem representar as componentes principais em combinação linear das variáveis originais que nos fornece depois os valores da Component Score Covariance que nos diz que as componentes são independentes pois apresentam correlações nulas entre si, resultado que será importante para o método de classificação hierárquica e não hierárquica.
2.4.2. Método de Classificação Hierárquica e Não Hierárquica
2.4.2.1.Classificação Hierárquica
Os métodos de classificação Hierárquico e não Hierárquico permitem agrupar diferentes unidades estatísticas em grupos o mais homogéneos possível internamente e o mais heterogéneo possível entre si.
O que define estes dois métodos é o facto de o de classificação hierárquico definir uma hierarquia de diferentes planos de classificação em que cada partição se agrupa sucessivamente classes de partições anteriores em novas classes, sem definir à partida um número determinado de classes a obter. Já no método de classificação não hierárquico o número de classes é fixado previamente e ligação de cada unidade geográfica a cada classe é determinada pelas interações sucessivas através de critérios de semelhança/dissemelhança adaptadas ao que está a ser analisado neste caso às unidades estatísticas e à natureza dos dados, concretamente para este estudo, dados quantitativos.
O estudo é feito novamente para as NUTS III e a análise de classificação tem como base as variáveis extraídas no processo de Análise da Componentes Principais, as Component Scores, evitando eventuais influencias nos resultados causados por diferentes unidades de medida das variáveis, não existindo assim a necessidade de proceder à estandardização das variáveis.
1 2 31 1,000 0,000 0,000
2 0,000 1,000 0,000
3 0,000 0,000 1,000
Component Score Covariance Matrix
Component
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Component Scores.
20
Localização de novas empresas em Portugal Continental em 2010
A classificação hierárquica parte da correspondência inicial de uma só unidade geográfica a uma classe. De forma sucessiva, o critério de separação entre classes vai sendo relaxado e vão-se agrupando pares de classes mais semelhantes, até que todas as unidades geográficas estejam afectas a uma só classe.
Tanto na Aglomeration Schedule como o Dendograma a partição deve ser feita no nível hierárquico com maior distância relativamente ao nível hierárquico seguinte, dado que pequenas distâncias apresentam ainda uma associação importante entre as unidades geográficas. Assim conclui-se que a partição com maior diferença de agregação se encontra na ordem 26 com 2 classes, de seguida na ordem 24 com 4 classes, e seguidamente na ordem 22 com 6 classes este resultado é comprovado pelo Dendograma.
2.4.2.2.Classificação Não Hierárquica – Método K-Means
O Método K-Means é um processo em que uma classificação inicial das unidades estatísticas por grupos homogéneos sofre uma reclassificação/reafectação iterativa até à altura em que uma reafectação adicional aumenta a heterogeneidade intra-classe e/ou a homogeneidade entre classes que não é desejável. Esta reafectação é feita segundo o critério da distância ao centro de classe, que se actualizará a cada iteração, em particular segundo o critério das distâncias euclidianas simples.
Escolhendo o número de classes igual a 6 o indicado peça classificação hierárquica temos:
Cluster 1 Cluster 2 Cluster 1 Cluster 21 12 13 ,029 0 0 6
2 17 24 ,036 0 0 4
3 8 15 ,065 0 0 9
4 17 25 ,069 2 0 7
5 19 27 ,071 0 0 11
6 7 12 ,092 0 1 11
7 17 26 ,130 4 0 12
8 16 18 ,151 0 0 15
9 8 20 ,176 3 0 15
10 1 6 ,198 0 0 17
11 7 19 ,240 6 5 17
12 9 17 ,255 0 7 19
13 2 11 ,287 0 0 21
14 3 5 ,304 0 0 18
15 8 16 ,317 9 8 20
16 10 23 ,547 0 0 19
17 1 7 ,609 10 11 20
18 3 14 ,652 14 0 21
19 9 10 ,763 12 16 22
20 1 8 1,388 17 15 22
21 2 3 1,543 13 18 23
22 1 9 1,661 20 19 23
23 1 2 4,180 22 21 24
24 1 4 6,420 23 0 25
25 1 22 12,106 24 0 26
26 1 28 17,170 25 0 27
27 1 21 27,714 26 0 0
Agglomeration Schedule
Stage
Cluster Combined
Coefficients
Stage Cluster First Appears
Next Stage
21
Localização de novas empresas em Portugal Continental em 2010
A tabela Anova apenas nos fornece as variáveis que mais contribuem para os resultados da classificação, neste caso e por ordem decrescente de importância temos a Dimensão das Empresas, depois a produtividade do trabalho e fim a concorrência a relação inversa entre rendibilidade das vendas e sobrevivência de empresas nascidas 2 anos antes.
Clusters Finais:
-‐ O Cluster 1 é composto pelas NUTS III Douro, Trás os Montes, Baixo Vouga, Baixo Mondego, Pinhal Interior, Dão-Lafões, Serra da Estrela, Beira Interior Norte; Beira Interior Sul; Cova da Beira, Oeste, Médio Tejo, Alentejo Litoral, Alto Alentejo, Alentejo Central, Baixo Alentejo e Lezíria do Tejo. Estas são unidades com fraca dimensão económica e fraca produtividade do trabalho são zonas do interior onde houve muita deslocalização de industria e de pessoas.
Unidade Geográfica Cluster Distance1 Minho-Lima 5 ,6792 Cávado 5 ,5743 Ave 5 ,6694 Grande Porto 4 0,0005 Tâmega 5 ,3336 Entre Douro e Vouga 5 ,458
7 Douro 1 ,6278 Alto Trás-os-Montes 1 ,804
9 Baixo Vouga 1 ,73010 Baixo Mondego 1 1,162
11 Pinhal Litoral 5 ,87612 Pinhal Interior Norte 1 ,396
13 Dão-Lafões 1 ,43314 Pinhal Interior Sul 5 ,896
15 Serra da Estrela 1 ,839
16 Beira Interior Norte 1 ,544
17 Beira Interior Sul 1 ,611
18 Cova da Beira 1 ,275
19 Oeste 1 ,88820 Médio Tejo 1 ,95921 Grande Lisboa 6 0,000
22 Península de Setúbal 2 0,000
23 Alentejo Litoral 1 ,716
24 Alto Alentejo 1 ,44825 Alentejo Central 1 ,312
26 Baixo Alentejo 1 ,635
27 Lezíria do Tejo 1 ,683
28 Algarve 3 0,000
Cluster Membership
Case Number
Mean Square df Mean Square dfREGR factor score 1 for analysis 3
5,239 5 ,037 22 143,025 ,000
REGR factor score 2 for analysis 3
4,302 5 ,249 22 17,249 ,000
REGR factor score 3 for analysis 3
4,411 5 ,225 22 19,634 ,000
Error
F Sig.
The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among cases in different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tes
ANOVA
Cluster
1 2 3 4 5 6REGR factor score 1 for analysis 3
-,32549 -,42479 -,53778 1,04122 ,09750 4,77209
REGR factor score 2 for analysis 3
,04209 2,99534 1,93017 ,95467 -1,03300 ,63533
REGR factor score 3 for analysis 3
-,49635 -,73590 3,27066 1,38690 ,76079 -,80929
Final Cluster Centers
Cluster
1 2 3 4 5 61 2,965 4,219 2,499 1,707 5,1422 2,965 4,147 3,289 4,329 5,7083 4,219 4,147 2,644 3,935 6,8204 2,499 3,289 2,644 2,288 4,3415 1,707 4,329 3,935 2,288 5,2066 5,142 5,708 6,820 4,341 5,206
Distances between Final Cluster Centers
Cluster
22
Localização de novas empresas em Portugal Continental em 2010
-‐ O Cluster 2 é apenas a Peninsula de Setubal com pequena dimensão económica e com fraca produtividade do trabalho, contudo tem um bom indicador de relação inversa entre Rendibilidade das Vendas e Solvabilidade de empresas nascidas 2 anos antes o que indicará que que há uma grande rendibilidade de vendas, mas poucas sobrevivências, isto poderá acontecer pela localização da autoeuropa uma das maiores empresas em Portugal continental e pela alta taxa de desemprego da região, o que a torna um mercado fraco em termos finais e assim poderá indicar que há muitas empresas que não se aguentam no mesmo.
-‐ O Cluster 3 é a Região do Algarve, é uma NUT com pequena dimensão económica, mas boa produtivida do trabalho e rácio de rendibilidade das vendas inverso à sobrevivência de empresas nasciadas 2 anos antes, isto poderá acontecer por ser uma região de elevado trabalho sazonal, pois tem meses muito bons (meses da época alta) e outros maus (época baixa) indiciando criação de empresas só para a altura boa do ano.
-‐ O Cluster 4 é o Grande Porto tem uma boa dimensão económica e boa produtividade do trabalho é a segunda região mais forte economicamente e o segundo centro de decisões de Portugal.
-‐ O Cluster 5 é o conjunto das NUT III Minho-Lima, Cávado, Ave, Tâmega, Entre o Douro e Vouga, Pinhal são regiões com alguma dimensão económica e com boa produtividade do trabalho, são zonas com alguma industria o se que reflete nos resultados.
-‐ O Cluster 6 é Lisboa é a região com maior dimensão económica, para comprovar os
resultados basta dizer que é a Capital e o centro de todas as decisões nacionais.
Quanto às distancias entre os Clusters, observa-se que a classe 6 é a mais afastada em relação a todas as outras classes. O maior afastamento é entre a classe 6 e 3 ou seja a NUT III Lisboa e a do Algarve e as classes mais próximas são a 1 e 5.
3. ANÁLISE ECONOMÉTRICA
3.1.Escolha das Variáveis
O objectivo do estudo é compreender de que forma os factores escolhidos influenciam a constituição de novas empresas, em que medida e qual o sentido dessa influência.
Efetuou-se um estudo cross-section, ou seja num determinado momento (o ano de 2010, onde foram recolhidos dados do número de sociedades constituídas por NUTS III, sendo esta a variável dependente.
23
Localização de novas empresas em Portugal Continental em 2010
O nosso objectivo agora é ver quais são os factores estão ligados ao nascimento de novas sociedades, positiva e negativamente e quais os que têm maior ou menor peso.
Assim foram recolhidos dados estatísticos referentes à potencial comercialização de bens e serviços intermédios e finais, à concorrência e ao funcionamento de mercado. O objectivo é com estas variáveis dependentes explicar a localização de novas empresas nas NUTs III.
Desta forma foram recolhidos os seguintes dados:
-‐ População Residente que representa o potencial de comércio final. -‐ Número de empresas existente que representa a oportunidade de relações comerciais
intermédias. -‐ Mortes de empresas que representa a oportunidade de entrada no mercado em
substituição de outras empresas. -‐ Volume de negócio das empresas que representa o comércio intermédio de matérias
primas e bens intermédio e acabados entre empresas e o potencial empresarial da região.
-‐ Densidade Populacional que representa a concentração de pessoas, ou seja um potencial maior número de cliente concentrados no local.
Daqui serão formuladas hipóteses de evidencia empírica para vermos se estes factores influenciam como teoricamente se prevê positiva ou negativamente e com que intensidade a criação de novas empresas em Portugal continental.
A hipótese que se formula é a seguinte:
Hipótese H1: A População Residente é importante na escolha da localização quando se pretende criar uma empresa, porque os empreendedores valorizam regiões com uma população numerosa, o que lhes proporcionará teoricamente uma mercado final superior.
Hipótese H2:
O número de empresas existentes representa o mercado empresarial existente na região, quanto maior for esse número maior será a rede empresarial e o potencial de relações comerciais, a nova empresa terá mais oportunidade de negócio e maior facilidade em adquirir know how e inovar. Este factor também tem uma relação positiva com o nascimento de novas sociedades.
Hipótese H3: O número de mortes de empresas é uma oportunidade de entrar no mercado substituindo existentes, é a oportunidade de captar clientes finais, trabalhadores e know how de outras empresas. Há teoricamente uma relação positiva com a criação de novas empresas.
24
Localização de novas empresas em Portugal Continental em 2010
Hipótese H4: Volume Acrescentado das empresas , representa a dimensão do mercado de intermédio e a a potencial criação de valor que existe na região , quanto maior for, maior é o potencial de trocas comercias de matérias primas e intermédias e produtos finais e serviços, logo a relação existente será teoricamente positiva, pois poderá gerar oportunidades de negócios.
Hipótese H5: A Densidade Populacional a concentração de pessoas numa região, potencializa o número de clientes situados numa determinada região. A relação deste factor com a criação de empresas será positivo.
3.2. O modelo econométrico
Foi construída uma regressão linear
NEmp = b1 + b2 PopR + b3 Emp +b4 MEmp+ b5 VABEmp + b6 DenPop + e
- NEmp é a variável dependente e representa o nascimento de novas empresas numa região.
- Os coeficientes da regressão são b1; b2; b3; b4; b5; b6
- As variáveis independentes são:
PopR– População Residente
Emp – Empresas existentes
MEmp – Morte de empresas
VBA – Volume Acrescentado das empresas
DenP –Densidade Populacional
-‐ e representa os resíduos da regressão
Mais uma vez todos os dados foram retirados do INE na sua página da Internet (www.ine.pt).
25
Localização de novas empresas em Portugal Continental em 2010
3.3.Análise dos Resultados Econométricos
Modelo de Regressão Linear
Dado da função de regressão da criação de empresas não ser empiricamente observável, pois os seu coeficientes são desconhecidos, foi necessário proceder á estimação desses coeficientes. Utilizou-se o método enter e obtiveram-se os valores apresentados no quadro seguinte:
Assim a equação de regressão do modelo linear é:
NEmp = -44,49182 +0,00185PopR+ 0,03536Emp+ 0,3345MEmp+ 0,01943VABE+ 0,67584DenPop + e
Através destes resultados vemos que todos os factores tiveram a relação esperada, ou seja positiva.
Qualidade do Ajustamento
Um critério da qualidade do ajustamento é a pertinência dos resultados obtidos, como visto acima os dados estão de acordo com o esperado.
Assim se a população residente aumentar 1000 pessoas são criadas 1,85 empresas, se o número de empresas da região aumentar 1000 serão criadas mais 35 novas empresas, se o Valor acrescentado for mais 1.000.000 de Euros o nascerão 0,019 empresas, se fecharem 1000 empresas serão criadas 335 e por fim se viverem mais 10.000 pessoas por km2 6,8 de novas empresas nascerão.
Outro critério é a análise a alguns indicadores como:
26
Localização de novas empresas em Portugal Continental em 2010
A análise de bondade esta é vista através da proporção de variância explicada pela regressão, no caso concreto o coeficiente de determinação é R2=0,999, resultado óptimo.
A análise de significância que é caracterizada pelo contributo que as variáveis explicativas têm no comportamento da variável dependente, pode ser individual (t student) ou conjunta (FSnedecor), contudo os dois testes são complementares, assim os valores da Tstudent e FSnedecor têm que ser inferiores a 5% para serem significantes. A significância do teste pode ser comprovada pela tabela que fornece os coeficientes e na tabela Anova analisando os valores da coluna p-nível (Sig. (λ)).
Modelos espaciais autoregressivos
Modelo OLS e Teste I de Moran
Nesta parte será analisado a presença de um factor de dependência espacial, realizando testes de autocorrelação espacial, que é a correlação de uma variável numa certa área com valores dessa mesma variável em áreas vizinhas. O teste baseado na estatística do I de Moran analisa a presença de um factor de dependência espacial. Este teste baseia-se nos resíduos da estimação OLS do modelo básico de regressão linear espacial, ele mede a relação do desvio padronizado de uma variável numa área com o desvio padronizado das áreas vizinhas para a mesma variável.
Assim o I de Moran é dado pela expressão seguinte e varia de -1 a 1.
27
Localização de novas empresas em Portugal Continental em 2010
Depois de encontrado o valor de índice é necessário ver se o valor é significativo ou não para isso pode utilizar-se o pseudo-significância dados que podemos ver no próximo quadro.
Ordinary Least-squares Estimates
Dependent Variable = NascE
R-squared = 0.9938
Rbar-squared = 0.9924
sigma^2 = 1330683587.5737
Durbin-Watson = 1.9771
Nobs, Nvars = 28, 6
***************************************************************
Variable Coefficient t-statistic t-probability
Const 25473.763939 1.625272 0.118346
POPR -6.976941 -1.917781 0.068212
Emp -104.647847 -5.070879 0.000044
MEmp -11.694059 -2.906626 0.008180
VABEmp -158.530835 -2.042007 0.053320
DenPop 309.923214 5.428388 0.000019
Moran I-test for spatial correlation in residuals
Moran I -0.01116183
Moran I-statistic 0.67689785
Marginal Probability 0.49847077
mean -0.07540182
standard deviation 0.09490352
28
Localização de novas empresas em Portugal Continental em 2010
Através da análise dos dados vemos que poderia existir uma correlação espacial inversa dado o valor de I ser negativo (-0,011), embora muito próximo de zero pelo que a correlação negativa seria pequena, contudo não é possível tirar nenhuma conclusão porque o nível de significância é muito elevado 9,5%.
Recorrendo agora ao Modelo SAR
O Modelo SAR (Mixed autogressive-regressive model) obtém-se a partir do modelo geral impondo a restrição de λ=0.
Spatial autoregressive Model Estimates
Dependent Variable = NascE
R-squared = 0.9939
Rbar-squared = 0.9925
sigma^2 = 1032661224.0535
Nobs, Nvars = 28, 6
log-likelihood = -320.60317
***************************************************************
Variable Coefficient Asymptot t-stat z-probability
Const 28496.358515 1.927351 0.053936
POPR -6.692647 -2.068493 0.038594
Emp -107.111012 -5.755887 0.000000
MEmp -13.130607 -3.061332 0.002204
VABEmp -177.738763 -2.351863 0.018680
DenPop 314.475585 6.182080 0.000000
rho -0.021968 -0.596834 0.550618
LM error tests for spatial correlation in SAR model residuals
29
Localização de novas empresas em Portugal Continental em 2010
LM value 0.03328480
Marginal Probability 0.85523648
chi(1) .01 value 6.63500000
Analisando os dados vemos que apesar de ter uma variância explicada ótima (0,99) o factor de dependência espacial não é relevante pois rho apresenta um valor estatisticamente não significativo (>5%, neste caso 5,5%), não é assim possível retirar conclusões quanto à dependência espacial.
No que respeita à autocorrelação espacial, no modelo SAR realizada através do Teste LM, os valores observados de 0,033 para o rácio LM, de 6,645 para o Quiquadrado e de 85% (>5%) revelam ausência de correlação espacial neste ajustamento pelo que não se justifica a passagem ao modelo SAC.
Análise do Modelo SEM
Spatial error Model Estimates
Dependent Variable = NascE
R-squared = 0.9938
Rbar-squared = 0.9924
sigma^2 = 1044606914.0418
log-likelihood = -320.76823
Nobs, Nvars = 28, 6
***************************************************************
Variable Coefficient Asymptot t-stat z-probability
Const 25074.704492 1.842484 0.065404
POPR -6.885790 -2.154984 0.031163
Emp -104.979160 -5.813795 0.000000
MEmp -11.678871 -3.245884 0.001171
VABEmp -158.489444 -2.309474 0.020917
30
Localização de novas empresas em Portugal Continental em 2010
DenPop 309.744506 6.186778 0.000000
lambda -0.044961 -0.149807 0.880917
Mais uma vez o valor da variância é ótimo (0,99), contudo o valor de λ é 88% (>5%) tornando o factor de dependência espacial sem significado.
Assim podemos concluir que a introdução da dependência espacial não revelou a existência de estruturas de correlação espacial, ou seja a probabilidade de construir uma empresa em determinada NUT III não parece ser influenciada pela criação de empresas em NUTS III vizinhas.
4. Possibilidade de Investigações Futuras
Os resultados econométricos mostram através da regressão linear que há vários factores que influenciam o criação de empresas, mas seria interessante realizar um estudo que com mais variáveis tais como os impostos pagos pelas empresas, custos com pessoal, produção ou nível de estudos dos trabalhadores. E realiza-lo também por sectores de actividade. Poderia ainda investigar-se as razões para a aparente inexistência de dependência espacial.
5. Bibliografia
Prof. Flávio Henrique M de A Freire, Introdução à Estatística Espacial, http://www.observatoriodasmetropoles.ufrj.br em 6/02/2013
<www.ine.pt> em 05/02/2013