Download - ANABELE LINDNER Análise desagregada de dados de … · “Se projetas alguma coisa, ela te sairá bem e a luz brilhará em teus caminhos”. Jó, 22:28 . AGRADECIMENTOS ... da variável,

Transcript
  • UNIVERSIDADE DE SO PAULO

    ESCOLA DE ENGENHARIA DE SO CARLOS

    ANABELE LINDNER

    Anlise desagregada de dados de demanda por transportes atravs de modelagem

    geoestatstica e tradicional

    So Carlos

    2015

  • ANABELE LINDNER

    Anlise desagregada de dados de demanda por transportes atravs de modelagem

    geoestatstica e tradicional

    Dissertao apresentada Escola de Engenharia de So Carlos como parte dos requisitos para a obteno do ttulo de Mestre em Cincias, Programa de Ps-graduao em Engenharia de Transportes.

    rea de concentrao: Planejamento e Operao de Sistemas de Transporte.

    Orientadora: Prof. Dra. Cira Souza Pitombo

    So Carlos

    2015

  • AUTORIZO A REPRODUO TOTAL OU PARCIAL DESTE TRABALHO,POR QUALQUER MEIO CONVENCIONAL OU ELETRNICO, PARA FINSDE ESTUDO E PESQUISA, DESDE QUE CITADA A FONTE.

    Lindner, Anabele L735a Anlise desagregada de dados de demanda por

    transportes atravs de modelagem geoestatstica etradicional / Anabele Lindner; orientadora Cira SouzaPitombo. So Carlos, 2015.

    Dissertao (Mestrado) - Programa de Ps-Graduao em Engenharia de Transportes e rea de Concentrao emPlanejamento e Operao de Sistemas de Transporte --Escola de Engenharia de So Carlos da Universidade deSo Paulo, 2015.

    1. Geoestatstica. 2. Regresso logstica. 3. Demanda por transportes. I. Ttulo.

  • Se projetas alguma coisa, ela te sair bem

    e a luz brilhar em teus caminhos.

    J, 22:28

  • AGRADECIMENTOS

    Agradeo primeiramente a Deus, pelas oportunidades concebidas em minha vida e

    fora contemplada na jornada.

    Agradeo minha famlia, especialmente aos meus pais, pelos princpios ensinados,

    os quais permitiram que eu me tornasse uma pessoa perseverante.

    Agradeo ao Conselho Nacional de Desenvolvimento Cientfico e Tecnolgico

    (CNPq) pelo apoio pesquisa.

    Agradeo professora, Cira Souza Pitombo, que se prontificou a me orientar e

    sempre foi muito solcita e disponvel.

    Agradeo s amizades que se edificaram nesta etapa. Tenho uma imensa gratido

    pelos amigos Felipe Costa Bethonico, Lucas Assirati e Samille Santos Rocha, no

    apenas pelo companheirismo, mas tambm pela preocupao, solidariedade e apoio

    nos momentos difceis deste Mestrado.

    Agradeo ao amicssimo Diego Fernandes Neris, que me encorajou a fazer esta Ps

    Graduao e me inspira com o seu sucesso.

    Agradeo a Mrcia Pereira de Andrade, professora fundamental na minha iniciao

    aos estudos da rea de Engenharia de Transportes desde o perodo da Graduao.

  • RESUMO

    LINDNER, A. Anlise desagregada de dados de demanda por transportes atravs de modelagem geoestatstica e tradicional. 2015. 106p. Dissertao

    (Mestrado em Cincias) - Departamento de Engenharia de Transportes, Escola de

    Engenharia de So Carlos, Universidade de So Paulo, So Carlos, 2015.

    O conhecimento do padro de deslocamento populacional bem como a estimativa

    de demanda por transportes so de fundamenta l importncia para a tomada de

    decises relativas ao planejamento urbano e de transportes. Em geral, a obteno

    destas informaes realizada por modelos tradicionais como o modelo quatro

    etapas. Entretanto, modelos clssicos no levam em conta a dependncia espacial

    das variveis. A Geoestatstica, valendo-se da utilizao de variveis regionalizadas,

    apresenta-se como uma ferramenta auxiliar capaz de modelar informaes

    espaciais. Este trabalho tem por objetivo estimar dados desagregados de demanda

    por transportes atravs de modelagem geoestatstica e tradicional. Neste estudo, a

    modelagem tradicional e a geoestatstica puderam ser comparadas por meio de um

    banco de dados referente pesquisa Origem/Destino da Regio Metropolitana de

    So Paulo, realizada em 2007. A abordagem tradicional se baseou em um modelo

    de regresso enquanto que a abordagem geoestatstica consistiu na estimao

    espacial de variveis com base na modelagem de semivariogramas e Krigagem. Ao

    final do trabalho, foi possvel realizar a comparao dos resultados da abordagem

    tradicional e geoestatstica em coordenadas de valores conhecidos. Os resultados

    indicaram que a modelagem tradicional apontou uma taxa de acertos de 96% pelo

    modelo de Regresso Logstica Mltipla adotada para a varivel dicotmica de preferncia por modo motorizado (varivel objeto de estudo). A abordagem tradicional baseou-se na calibrao de um modelo por meio de outras oito variveis.

    Entretanto, a modelagem geoestatstica, utilizando-se apenas das coordenadas

    geogrficas domiciliares, resultou em 67% de taxa de acertos de previso da

    varivel. Isso demonstrou que, apesar de possuir menor taxa de acertos, a

    modelagem geoestatstica, por utilizar menor nmero de informaes para previso

  • da varivel, teve um resultado satisfatrio e demonstra-se promissora na rea de

    planejamento de transportes, sobretudo considerando sua habilidade de estimao

    em outras coordenadas geogrficas alm das amostradas.

    Palavras-chave: Geoestatstica, regresso logstica, demanda por transportes.

  • ABSTRACT

    LINDNER, A. Disaggregated data analysis on transportation demand through traditional and geostatistical modeling. 2015. 106p. Thesis (Master of Science)

    Engineering School of So Carlos, University of So Paulo. So Carlos, 2015.

    The comprehension of population displacement patterns and travel demand

    forecasting is crucial on making decisions related to urban transportation planning. In

    order to obtain this information, classic models like the sequential Four-step model

    are applied. However, classic models do not consider spatial location in their

    approach. Geostatistics is displayed as a suitable complementary instrument able to

    model spatial information. This work intends to forecast disaggregated data on

    transportation demand through traditional and geostatistical modeling. The present

    study compares the results from classic approach and Geostatistics through an

    Origin-Destination Survey dataset, carried out in So Paulo Metropolitan Area in

    2007. The classic approach was based on regression models whereas Geostatistics

    consisted in variable spatial estimation by semivariograms modeling and Kriging. At

    the end of the study, a comparison between regression and geostatistical analysis

    was conducted through results of prediction in locations where the values of the

    variable are known. Results indicated that classic modeling had a 96% hit rate by

    Multiple Logistic Regression adopted for the dummy variable preference for motorized travel mode (object of study variable). Classic modeling was based on a training model using other eight predictor variables. Meanwhile, Geostatistics, using

    only residential geographical coordinate, resulted in a 67% hit rate for predicting the

    variable object of study. This demonstrates that, even though Geostatiscs had lower

    hit rate compared to Multiple Logistic Regression, it had satisfactory outcome and

    proves to be a promising approach in transport planning, given that it considered less

    information to predict the variable, especially considering its ability of estimating in

    other geographical coordinates in addition to those sampled.

    Keywords: Geostatistics, logistic regression, demand for transportation

  • .

  • LISTA DE FIGURAS

    Figura 2.1: Grfico de disperso para varivel dependente com apenas duas

    categorias.................................................................................................................. 35

    Figura 2.2: Curva S de probabilidade para a varivel dependente binria. .............. 36

    Figura 3.1: Etapa 1) para processo de obteno do semivariograma...................... 46

    Figura 3.2: Etapa 2) para processo de obteno do semivariograma...................... 46

    Figura 3.3: Etapa 3) para processo de obteno do semivariograma...................... 46

    Figura 3.4: Etapa 4) para processo de obteno do semivariograma...................... 47

    Figura 3.5: Parmetros para interpretao grfica do semivariograma.................... 48

    Figura 3.6: Representao de uma varivel espacial isotrpica e anisotrpica....... 49

    Figura 3.7: Exemplos de melhores ajustes para semivariogramas experimentais. .. 50

    Figura 3.8: Fluxograma para abordagem bsica de calibrao e validao de

    modelos..................................................................................................................... 51

    Figura 4.1: Regio Metropolitana de So Paulo e Zonas de Trfego....................... 59

    Figura 4.2: Representao dos domiclios apurados na Pesquisa O/D.................... 60

    Figura 4.3: Esquema simplificado do mtodo proposto............................................ 62

    Figura 4.4: Processo de calibrao/validao.......................................................... 67

    Figura 4.5: Representao da interpolao dos valores de coordenadas................ 70

    Figura 5.1: Histogramas das variveis de demanda por transporte.......................... 74

  • Figura 5.2: Semivariogramas experimentais nas direes: omnidirecional, (0, -90),

    (15, -75), (30, -60) e (45, -45) para preferncia por modo motorizado..............77

    Figura 5.3: Semivariogramas experimentais nas direes (60, -30) e (75, -15)

    para preferncia por modo motorizado......................................................................78

    Figura 5.4: Amplitudes e razes das direes estudadas e elipside de anisotropia

    geomtrica................................................................................................................. 79

    Figura 5.5: Semivariogramas ajustados para a direo principal (-15) e direo

    ortogonal (75)........................................................................................................... 79

    Figura 5.6: Mapa krigado para a varivel preferncia por modo motorizado.............80

    Figura 5.7: Mapa da taxa de acertos para a abordagem geoestatstica (validao

    pela mdia dos ns adjacentes).................................................................................83

    Figura 5.8: Mapa da taxa de acertos para a abordagem geoestatstica (validao

    cruzada)..................................................................................................................... 84

    Figura 5.9: Mapa da taxa de acertos por municpio para a RLM.............................. 87

    Figura 5.10: Grficos de comparao de taxas de acertos entre a modelagem

    Geoestatstica (mdia e validao cruzada) e a modelagem por RLM..................... 89

    Figura 5.11: Proporo de registros por municpio da RMSP................................... 90

  • LISTA DE TABELAS

    Tabela 3.1: Tipos de dados e problemas em anlise espacial................................. 40

    Tabela 4.1: Informaes dos municpios da RMSP.................................................. 61

    Tabela 4.2: Informaes uti lizadas da Pesquisa O/D RMSP 2007............................64

    Tabela 4.3: Medidas descritivas para as variveis quantitativas............................... 65

    Tabela 4.4: Percentual de observaes da varivel critrio de renda.......................65

    Tabela 4.5: Percentual de observaes da varivel preferncia por modo motorizado..................................................................................................................65

    Tabela 4.6: Medidas estatsticas avaliadas nas modelagens................................... 71

    Tabela 5.1: Parmetros para clculo dos semivariogramas experimentais. ............. 76

    Tabela 5.2: Resultados de validao pela mdia dos ns adjacentes (modelagem

    geoestatstica)........................................................................................................... 81

    Tabela 5.3: Resultados da validao cruzada (modelagem geoestatstica). ............ 82

    Tabela 5.4: Resultados para qualidade do ajuste da RLM....................................... 86

    Tabela 5.5: Resultados de validao para RLM........................................................ 87

  • LISTA DE ANEXOS E APNDICE

    Anexo 1: Mapa da Regio Metropoli tana de So Paulo ... .. .. .. .. ... .. .. .. ... . 105

    Apndice 1: Resultados de taxa de acertos para a validao por municpio....... 106

  • SUMRIO

    1. INTRODUO...................................................................................................... 25

    1.1 PROBLEMA DE PESQUISA........................................................................... 26

    1.2 JUSTIFICATIVA............................................................................................... 26

    1.3 OBJETIVO....................................................................................................... 27

    1.3.1 Objetivos especficos................................................................................. 27

    1.4 ESTRUTURA DO TRABALHO........................................................................ 27

    2. MODELAGEM DE DEMANDA POR TRANSPORTES......................................... 29

    2.1 CONSIDERAES INICIAIS...........................................................................29

    2.2 MODELO QUATRO ETAPAS..........................................................................31

    2.3 ESCOLHA MODAL.......................................................................................... 33

    2.3.1 Regresso Logstica.................................................................................. 35

    2.3.1.1 Regresso Logstica Simples ....................................................................................... 36

    2.3.1.2 Regresso Logstica Mltipla........................................................................................ 37

    2.3.1.3 Regresso Logstica Multinomial .................................................................................. 38

    3. ESTATSTICA ESPACIAL.................................................................................... 39

    3.1 CONCEITOS DE ESTATSTICA ESPACIAL.................................................. 39

    3.2 GEOESTATSTICA.......................................................................................... 42

    3.2.1 Anlise das variveis regionalizadas......................................................... 43

    3.2.2 Modelagem de semivariogramas experimentais........................................ 44

    3.2.2.1 Parmetros para definio do semivariograma............................................................ 44

    3.2.2.2 Processo de obteno do semivariograma................................................................... 45

  • 3.2.2.3 Interpretao grfica do semivariograma..................................................................... 47

    3.2.2.4 Ajuste do semivariograma experimental ....................................................................... 49

    3.2.3 Validao ................................................................................................... 51

    3.2.4 Krigagem .................................................................................................... 54

    3.2.4.1 Krigagem Indicativa (KI)................................................................................................ 55

    3.2.5 Geoestatstica e Transportes..................................................................... 57

    4. MATERIAIS E MTODO...................................................................................... 59

    4.1 MATERIAIS..................................................................................................... 59

    4.1.1 Banco de dados e rea de estudo ............................................................. 59

    4.1.2 Software .....................................................................................................62

    4.2 MTODO.......................................................................................................... 62

    4.1.1 Tratamento e visualizao de dados......................................................... 63

    4.1.2 Escolha da varivel objeto de estudo........................................................ 66

    4.1.3 Modelagem de demanda por transportes.................................................. 66

    4.1.3.1 Modelagem geoestatstica............................................................................................ 67

    4.1.3.2 Modelagem tradicional .................................................................................................. 71

    4.1.4 Comparao dos resultados...................................................................... 72

    5. RESULTADOS E DISCUSSES.......................................................................... 73

    5.1 TRATAMENTO E VISUALIZAO DE DADOS............................................. 73

    5.2 ESCOLHA DA VARIVEL OBJETO DE ESTUDO......................................... 74

    5.3 MODELAGEM GEOESTATSTICA................................................................. 75

    5.3.1 Anlise da estrutura espacial ..................................................................... 76

    5.3.2 Krigagem .................................................................................................... 80

    5.3.3 Validao ................................................................................................... 81

  • 5.3.3.4 Validao por municpio............................................................................................... 83

    5.4 MODELAGEM TRADICIONAL........................................................................ 84

    5.4.1 Regresso Logstica Mltipla ..................................................................... 84

    5.4.2 Validao ................................................................................................... 86

    5.4.2.1 Validao por municpio............................................................................................... 87

    5.5 COMPARAO DOS RESULTADOS............................................................ 88

    6. CONCLUSES E RECOMENDAES............................................................... 91

    5.1 CONCLUSES................................................................................................ 91

    5.2 RECOMENDAES........................................................................................ 95

    REFERNCIAS BIBLIOGRFICAS....................................................................... 97

    LISTA DE ANEXOS E APNDICE ........................................................................ 105

  • 25

    1. INTRODUO

    No captulo 1 dessa dissertao, uma introduo feita apresentando o problema da pesquisa, a justificativa do estudo, os objetivos e a estrutura do texto.

    Estimativas de demanda por transportes auxiliam a tomada de deciso

    relativa ao planejamento urbano e de transportes. Tradicionalmente, so utilizados

    modelos diretos ou sequenciais para prever a demanda por transportes. O modelo

    mais utilizado ainda o modelo quatro etapas, as quais so: (1) gerao de viagens;

    (2) distribuio de viagens; (3) diviso modal e (4) alocao de trfego.

    Os modelos clssicos, usualmente, no consideram a dependncia espacial

    de dados na anlise. Diante deste fato, a incluso de tcnicas de anlise espacial

    preenche essa lacuna e abre espao para uma ferramenta adicional para incremento

    de modelagem e estimao da demanda por transportes, a partir da incorporao de

    localizaes espaciais.

    Tcnicas de anlise espacial diferenciam-se das tcnicas tradicionais. Ao

    invs de serem promovidas anlises estatsticas globais, ou seja, dos dados como

    um todo sem a preocupao da posio espacial, so realizadas anlises

    estatsticas locais com o enfoque de expor os resultados obtidos em uma

    representao grfica.

    No contexto da anlise espacial, a geoestatstica se diferencia, pois, aps a

    realizao das estatsticas locais por meio de semivariogramas, os resultados

    obtidos so uti lizados como instrumento para o processo de estimao denominado

    Krigagem. Mostra-se, ento, como uma ferramenta completa, porque, alm de

    promover a anlise dos dados pr-existentes, capaz de inferir sobre dados

    desconhecidos.

    A aplicao da Geoestatstica passou a ser mais usual na dcada de 1980,

    sendo utilizada pela lavra e prospeco mineira, agricultura de preciso, anlise

  • 26

    espacial de crimes, cartografia, climatologia, oceanologia, geotecnia, hidrogeologia

    (YAMAMOTO e LANDIM, 2013). A utilizao das tcnicas de Geoestatstica na

    Engenharia de Transportes ainda incipiente. Autores como Braxmeier et al. (2005) e Du e Aultman-Hall (2006) iniciaram pesquisa com aplicao de tcnicas de

    interpolao espacial de dados (Krigagem) para estimao da velocidade e do

    tempo de viagem.

    1.1 PROBLEMA DE PESQUISA

    O problema da presente pesquisa, que motivou a realizao do trabalho,

    baseia-se no fato de que a modelagem tradicional de demanda por transportes

    desconsidera a localizao espacial das variveis. No entanto, sabe-se que a

    demanda por transportes um problema locacional, alm de socioeconmico e

    demogrfico.

    1.2 JUSTIFICATIVA

    Embora os mtodos tradicionais no abordem a localizao espacial das

    variveis na anlise, a Geoestatstica considera essa condio e se mostra

    potencialmente vantajosa para modelagem e estimao de demanda por

    transportes. Contudo, so poucos os trabalhos na rea de estatstica espacial para o

    planejamento de transportes. O trabalho aqui exposto procura contribuir com

    informaes e propor mtodo que viabilize a aplicao da Geoestatstica no

    planejamento de transportes para que a tcnica aprimore estudos j existentes. Da

    mesma forma, pretende-se contribuir com as adequaes de dados relativos a

    viagens na abordagem da anlise geoestatstica.

    Este trabalho de mestrado utilizou dados desagregados (por domiclio), os

    quais puderam se adequar melhor s suposies de continuidade espacial da

  • 27

    Geoestatstica, quando comparados a dados agregados por zonas de trfego, por

    exemplo.

    1.3 OBJETIVO

    O trabalho teve como objetivo principal estimar dados desagregados de

    demanda por transportes atravs de modelagem geoestatstica e tradicional.

    1.3.1 Objetivos especficos

    Obter estimativas da varivel de estudo pela abordagem tradicional de anlise

    de demanda por transportes;

    Obter a superfcie espacial de estimao da varivel objeto de estudo;

    Testar a adequabilidade da tcnica de anlise espacial por meio de

    comparao entre as abordagens;

    Analisar os resultados da modelagem por municpio da RMSP, discutindo as

    similaridades e diferenas.

    1.4 ESTRUTURA DO TRABALHO

    A dissertao de mestrado, aqui apresentada, formada por seis captulos,

    alm desta introduo.

    No segundo e terceiro captulos, so apresentados embasamentos tericos

    para o pleno entendimento deste trabalho. O segundo captulo aborda alguns

    conceitos bsicos de modelagem tradicional utilizados na anlise de demanda por

    transportes. No terceiro captulo, so apresentadas consideraes sobre as tcnicas

    de anlise espacial de dados e conceitos relacionados anlise espacial de

    superfcies, conhecida como Geoestatstica.

  • 28

    No quarto captulo so explanados os materiais, software e o mtodo utilizados para a obteno da estimao da varivel objeto de estudo a ser definida

    por meio de modelagem geoestatstica e tradicional (regresso).

    O quinto captulo apresenta os resultados obtidos seguindo-se as etapas do

    mtodo proposto, bem como as principais discusses. O sexto captulo expe as

    concluses e recomendaes.

  • 29

    2. MODELAGEM DE DEMANDA POR TRANSPORTES

    O captulo 2 tem por intuito oferecer ao leitor um referencial terico acerca dos mtodos tradicionais de modelagem de demanda. O texto enfatiza o modelo de quatro etapas, pois este ainda o mais utilizado na prtica. Alm disso, o captulo reserva um enfoque relacionado escolha modal, especificamente descrevendo modelos logsticos.

    2.1 CONSIDERAES INICIAIS

    Um modelo criado com a finalidade de representar um sistema. Tal

    representao pode ser realizada atravs de vrios tipos de linguagem: matemtica,

    lgica, grfica, fsica (modelo reduzido).

    A elaborao de um modelo objetiva a simplificao da realidade e a

    definio de elementos e relaes relevantes.

    Modelos podem ser classificados com referncia s tcnicas utilizadas

    (WILSON 1 , 1967 apud NOVAES, 1982): i) anlises estatsticas; ii) sistemas de equao; iii) simulao; iv) algoritmos ou processos heursticos.

    Tradicionalmente, o embasamento para modelagem de fenmenos urbanos

    e de demanda por transportes segue quatro tipos bsicos de posturas cientficas

    (NOVAES, 1982):

    a) Abordagem emprica: ajuste de relaes matemticas, comumente amparado

    por anlise de regresso ou outro processo estatstico.

    b) Enfoque microanaltico ou comportamental: conduta geral determinada por

    anlise de comportamento de indivduos. Um entrave encontrado pela

    adoo dessa tcnica est no fato de que indivduos submetidos a mesmas

    condies atuam de formas diferentes.

    1 Wilson, A. (1967) Mathematical models in planning. Architectural Association Journal, 82, p. 260-65.

  • 30

    c) Analogias: os elementos objetos de estudo so analisados de maneira

    alusria a tcnicas e modelos utilizados em outros campos da cincia. Um

    exemplo clssico no planejamento de transportes o modelo gravitacional.

    d) Enfoque macroanaltico ou da fsica social: consiste no estabelecimento de

    relaes baseadas no comportamento individual de cada categoria e os nveis

    de demanda agregados, que so observados na realidade atravs de

    formulaes probabilsticas.

    Embora desenvolvidas no passado, essas tcnicas ainda so amplamente

    utilizadas. Por meio do advento de recursos computacionais e matemticos

    modernos e mais precisos, tais tcnicas tm sido aprimoradas por meio de

    ferramentas, que antes eram inviveis. Dentre essas ferramentas, pode-se citar a

    Anlise Espacial (Regresso Espacial), Redes Neurais, Lgica Fuzzy, Algoritmos

    Genticos e Autmatos Celulares e Sistemas de Informao Geogrfica (SIG).

    Lopes (2005) demonstrou, em seu trabalho, que a introduo de variveis

    espaciais ao estudo de modelos de demanda por transporte apresentou resultados

    positivos, quando comparados a modelos tradicionais. Isso acontece, pois os SIGs

    permitem a identificao de padres espaciais das variveis de demanda por

    transportes e das variveis socioeconmicas, enquanto as demais ferramentas

    restringem-se caracterizao das relaes intervenientes nas variveis modeladas.

    (PAIVA, 2010).

    Contudo, apesar de conveniente a introduo de novos conceitos e tcnicas,

    necessrio o entendimento das abordagens tradicionais.

    Estimativas de demanda por transportes auxi liam a tomada de deciso

    relativa ao planejamento urbano. A previso da demanda por modelos tradicionais

    considera a utilizao do sistema de transportes em funo da dinmica do

    ambiente. O modelo mais uti lizado ainda o modelo quatro etapas, descrito na

    prxima seo.

  • 31

    2.2 MODELO QUATRO ETAPAS

    Um dos modelos largamente empregado no planejamento de transportes o modelo sequencial de quatro etapas (SOUZA e DAGOSTO, 2013; PALHARES, 2008; PEREIRA e OLIVEIRA, 2014). Apesar de ser conhecido como um modelo, se

    configura mais como um mtodo ou um procedimento e sua finalidade , principalmente, a de previso de viagens entre as diversas zonas de trfego (matriz O/D). O mtodo se baseia no contexto de que a realizao de uma viagem tem estreita relao com um processo desenvolvido em quatro fases: i) Gerao de viagens, ii) Distribuio de viagens, iii) Diviso Modal e iv) Alocao de Trfego (LOPES, 2005; TEDESCO, 2008). As quatro etapas so descritas, de maneira sintetizada, em seguida.

    i) Gerao de viagens

    Origina o processo com a finalidade de prever o nmero de viagens de e

    para uma determinada regio em estudo (viagens produzidas e atra das por unidade de rea considerada). Tal previso geralmente realizada por mtodos de estimao de demanda. Os resultados dessa etapa servem de ponto de partida para

    as demais etapas do processo. Ortzar e Willumsen (2011) apresentam os

    seguintes fatores que influenciam a produo de viagens: renda, propriedade de automvel, estrutura do domic lio, tamanho da famlia, valor do solo, densidade residencial, acessibilidade. Como fatores que influenciam a atrao de viagens numa dada zona pode-se citar: o nmero de empregos ofertados, o nvel de atividade comercial e o nmero de matrculas escolares. Os seguintes modelos de gerao de viagens podem ser citados: Fator de Crescimento, Taxas de Viagens, Anlise de Categorias e Regresso.

    ii) Distribuio de viagens

    Este o procedimento de distribuio de demanda de uma rea para as demais, originando uma matriz de origens e destinos de viagens (pares O/D).

  • 32

    Usualmente utilizam-se modelos baseados em analogia, sendo o gravitacional o

    mais pertinente para esse fim (MEYER e STRASZHEIM, 1974). Outros modelos

    comumente aceitos so os Modelos de Fator de Crescimento tais como o Mtodo do Crescimento Uniforme, o Mtodo do Crescimento Mdio, Mtodo de Fratar e o Mtodo de Furness.

    iii) Diviso modal

    Esta etapa objetiva a alocao de pares O/D entre os meios de transporte

    existentes (ou a serem criados), sem a preocupao com a definio das rotas. A

    diviso modal feita com base nas variveis que o usurio utiliza para fazer a sua escolha. Os fatores que influenciam a escolha modal incluem usualmente

    caractersticas socioeconmicas e caractersticas dos servios dos modos de transporte. Os modelos de diviso modal classificam-se em determinsticos e probabilsticos. Os modelos determinsticos utilizam mtodos quantitativos para

    determinar a proporo de viagens em cada modo, tais como Regresso Linear, Classificao Cruzada, Curvas de Desvio. Os modelos probabilsticos utilizam a probabilidade de escolha de cada modo para determinar a proporo de viagens. Os

    modelos probabilsticos mais utilizados so os economtricos (logstico e probit).

    iv) Alocao de Trfego

    A ltima etapa do processo consiste na alocao dos fluxos de cada modo

    para cada par O/D da rede de transportes (OLIVEIRA, 2013). Os modelos de

    alocao so utilizados para fornecer estimativas de fluxos de trfego em vias estratgicas. Um conceito que deve ser considerado em quase todos os modelos de atribuio de trfego o custo de deslocamento. Diante das diversas alternativas que o usurio tenha para efetuar uma viagem, naturalmente ponderada uma srie

    de fatores para decidir qual percurso seguir.

    O mtodo de quatro etapas foi um dos componentes do Urban Transportation Planning System (UTPS), desenvolvido nos EUA, com o objetivo de

  • 33

    promover uma padronizao dos mtodos de modelagem para transportes (HANSON e GIULIANO, 2004). Um fato importante a ser considerado o de que, apesar de induzir o pensamento de que as etapas devam ter sua sequncia

    respeitada, esta no uma obrigao. Inicialmente, o modelo foi concebido em trs etapas, sendo que a etapa de diviso modal foi adicionada a partir dos anos 60, passando a considerar os modos privados e pblicos. Desde ento, este modelo

    passou a considerar as viagens como um fator associado s pessoas e no aos automveis (TEDESCO, 2008).

    Apesar de amplamente utilizado, o modelo de quatro etapa, devido sua natureza sequencial, pode propagar eventuais erros sem que se saibam quais sero os efeitos finais (VASCONCELOS, 2000). Alm disso, o modelo no considera a dependncia espacial das variveis. Neste contexto, torna-se conveniente a

    utilizao de novas abordagens relativas aos modelos, como a incluso de variveis com dependncia espacial (variveis regionalizadas) por meio da Geoestat stica, por exemplo.

    2.3 ESCOLHA MODAL

    Variveis como o nmero de viagens produzidas e atradas, fluxo de trfego

    e escolha modal so essenciais para o planejamento e previso de demanda por

    transportes. Dentre essas variveis, a previso da varivel de escolha modal, que se

    caracteriza como altamente dependente de fatores humanos, se baseia em fatores

    comportamentais. Os fatores comportamentais podem ser divididos em:

    Descritivos: explicam como os indivduos se comportam;

    Abstratos: so baseados em termos no especficos a uma situao particular;

    Operacionais: os parmetros e variveis necessitam ser estimados e mensurados

    (RODRIGUES, 2012).

    Conforme Rodrigues (2012), modelos probabilsticos so capazes de

    representar o comportamento dos indivduos de maneira satisfatria, considerando

    os trs fatores comportamentais.

  • 34

    Existem muitos casos em que o fenmeno que se deseja modelar discreto,

    ao invs de contnuo. Esses so casos em que as decises estudadas so

    resultados de uma seleo dentre distintas alternativas discretas. Nesses casos,

    conveniente o uso de modelos de escolha discreta. Os modelos de escolha discreta

    podem ser de trs tipos:

    Categricos: a varivel dependente no tem significado por si s, representa

    apenas uma codificao, ex: 1, se o indivduo trabalha e 0, caso contrrio.

    Com resposta ordenada: a varivel dependente reflete um conceito por trs

    de sua ordem, ex: 1 muito satisfeito, 2 satisfeito, 3 insatisfeito.

    Contveis: a varivel dependente tem significado por si s, ex: nmero de

    patentes registradas de um pas.

    Alm dos modelos economtricos e de pressupostos de escolha discreta,

    relevantes a estudos de demanda por transportes, importante destacar a Funo

    Utilidade. Uma Funo Utilidade uma expresso matemtica que determina o grau

    de satisfao que o usurio do transporte obtm com a escolha do modo. De forma

    geral, a Funo Utilizada definida pela soma de variveis e seus pesos relativos,

    tal como indicada pela Equao 2.1.

    = 0 + 11 + 22 + + (2.1)

    Onde, U a utilidade derivada da escolha medida pelos atributos, xi, xi so

    as variveis de transporte, ai so os pesos relativos s variveis e o erro aleatrio que segue distribuio de Weibull. Exemplos dos atributos relativos a

    transportes so: custo, tempo de viagem, tempo de espera, e algumas variaes

    destes. A escolha pela uti lidade prev que o tomador de decises realize

    compensaes entre os atributos de cada modo para escolher um no qual seu

    benefcio seja o maior possvel (NOVAES, 1982), tal como:

    UMODO1 > UMODO 2 > UMODO 3 Escolhe-se o modo 1.

  • 35

    2.3.1 Regresso Logstica

    Para prever se uma alternativa ser escolhida, o valor de um determinado

    modo pode ser contrastado com uma opo alternativa, de maneira a ser

    transformado em uma probabilidade entre 0 e 1. Entretanto, escolhas discretas

    no podem ser calibradas usando ajustes de curva como mnimos quadrados, pois

    sendo a varivel dependente uma probabilidade, a modelagem por uma curva em

    forma de S se faz necessria. Um dos modelos de escolha discreta mais utilizado na

    Engenharia de Transporte o logstico (ORTZAR e WILLUMSEN, 2011).

    Se a discretizao se restringe apenas a duas opes, a regresso logstica

    dita binomial, caso haja mais opes, a regresso generalizada e nomeada

    multinomial. Vale salientar que essas regresses tambm so denominadas por

    Modelos Logit Binomial e Logit Multinomial.

    A diferena da Regresso Logstica para a Regresso Linear de que a

    varivel dependente no contnua, mas sim, qualitativa. A Regresso Logstica

    Binomial normalmente expressa por duas categorias (binrias), conforme

    representado pela Figura 2.1, que representa a relao entre varivel dependente

    binria (y) e varivel independente contnua (x).

    Figura 2.1: Grfico de disperso para varivel dependente com apenas duas categorias.

    Portanto, o mtodo dos mnimos quadrados que era a base da Regresso

    Linear, j no oferece estimadores plausveis. A soluo para isso o uso da

    Regresso Logstica, pois essa permite o uso de um modelo (curva em S) para

    prever a probabilidade de um evento especfico, ilustrado na Figura 2.2.

  • 36

    Figura 2.2: Curva S de probabilidade para a varivel dependente binria.

    2.3.1.1 Regresso Logstica Simples

    Na Regresso Logstica Simples, a varivel dependente possui apenas duas

    categorias (0 e 1) e apenas uma varivel independente envolvida. O modelo de

    Regresso para a curva S normalmente implica em dificuldades relativas ao clculo.

    Para isto possvel considerar uma transformao logstica de que calculada mais facilmente. A funo logstica g (x) dada por:

    g x = ln

    1 (2.2)

    g x = 0 + 1 x (2.3)

    Sendo 0 e 1 os coeficientes da equao de calibrao.

    Em posse da Regresso Logstica Simples (Equao 2.3), simples calcular

    o valor da probabilidade .

    =1

    1 + eg(x) (2.4)

    Anlises qualitativas podem ser feitas considerando as equaes 2.3 e 2.4:

    Se 1 < 0, crescente Se 1 > 0, decrescente Se x e 1 < 0, 0 Se x e 1 > 0, 1 Se 1 = 0, g(x) independente de x

  • 37

    Em nveis muito baixos, a probabilidade tende a 0. Entretanto, quando a

    varivel aumenta, a probabilidade aumenta para cima da curva, mas em seguida, a

    inclinao comea a diminuir, de forma que, em qualquer nvel, a probabilidade

    tender a 1, no extrapolando esse valor.

    A qualidade do ajuste pode ser mensurada atravs de medidas estatsticas

    tradicionais como erro padro e significncia; e tambm por medidas estatsticas

    apropriadas apenas para a anlise de Regresso Logstica, tais como: valor Wald,

    valor da verossimilhana (-2LL), testes de regresso de Cox & Snell e Nagelkerke,

    chi-quadrado avaliado pelo teste de Hosner & Lemeshow (HAIR et al., 2010).

    2.3.1.2 Regresso Logstica Mltipla

    A Regresso Logstica Mltipla (RLM) consiste da generalizao do modelo

    de Regresso Logstica Simples. Novamente, a varivel dependente binria,

    porm, existe mais de uma varivel independente, ou seja, caso mltiplo.

    A generalizao consiste em uma alterao na funo logstica, que agora

    considera as mltiplas variveis independentes:

    g x = 0 + 1x1 + 2x2 ++n xn (2.5)

    g x = i xi

    n

    i=0

    (2.6)

    Sendo x0 = 1, 0, 1,..., n os coeficientes da equao de calibrao e n o

    nmero de variveis independentes.

    Por meio da Regresso Logstica Mltipla (Equao 2.6), calcula-se a

    probabilidade (Equao 2.4), com g(x) adequado.

    As mesmas medidas de avaliao da Regresso Logstica Simples podem

    ser usadas para RLM.

  • 38

    2.3.1.3 Regresso Logstica Multinomial

    Pode-se modificar a Regresso Logstica Mltipla de maneira que a varivel

    dependente apresente mais de dois nveis de codificao. Ao invs de apenas ter-se

    0 e 1, agora pode-se obter 0, 1, 2, por exemplo.

    Faz-se necessrio k funes logsticas para cada uma das k categorias que

    a varivel dependente pode assumir:

    g1 x = 1,0 + 1,1x1 + 1,2x2 + +1,n xn

    g2 x = 2,0 + 2,1x1 + 2,2x2 ++2,n xn

    gk x = k,0 + k,1x1 + k ,2x2 ++k ,n xn

    gk x = k,i xi

    n

    i=0

    (2.7)

    Sendo x0 = 1, k,0, k,1,..., k,n os coeficientes da equao de calibrao e n o

    nmero de variveis independentes.

    Isso ir gerar as probabilidades k para cada uma das k classes.

    k =1

    1 + egk (x) (2.8)

    As medidas de avaliao usadas na Regresso Logstica Simples e

    Regresso Logstica Mltipla tambm podem ser usadas para Regresso Logstica

    Multinomial (FIGUEIRA, 2006).

  • 39

    3. ESTATSTICA ESPACIAL

    O captulo 3 versa sobre o referencial terico acerca da estatstica espacial, com nfase na Geoestatstica. A estatstica espacial de grande relevncia, uma vez que apresenta um mtodo alternativo de anlise quando comparado aos modelos clssicos de demanda por transportes. O captulo tambm descreve e conceitualiza o processo de modelagem geoestatstica: (1) anlise de variveis regionalizadas, (2) modelagem de semivariogramas experimentais, (3) validao e (4) Krigagem.

    3.1 CONCEITOS DE ESTATSTICA ESPACIAL

    Compreender a distribuio espacial de dados oriundos de fenmenos

    ocorridos no espao constitui um grande desafio para a elucidao de questes

    centrais em diversas reas do conhecimento, seja em sade (LAPA et al., 2006), em economia (PEROBELLI, 2004), em meteorologia (SIQUEIRA et al., 2007), em transportes (PITOMBO et al., 2010a). Com o advento de recursos computacionais poderosos, tornam-se cada vez mais usuais estudos onde a distribuio espacial

    dos dados avaliada. Este processo denominado An lise Espacial (DRUCK et al., 2004).

    Anlises estatsticas tradicionais, baseadas na independncia das

    observaes, tm sido substitudas por anlises espaciais, as quais consideram as

    correlaes entre observaes vizinhas. Estas anlises so baseadas na teoria das

    variveis regionalizadas (MATHERON, 1971), a qual considera as caractersticas

    estruturais e aleatrias de uma varivel espacialmente distribuda, de forma a

    descrev-la adequadamente.

    Um dos conceitos bsicos de anlise espacial o estudo do comportamento

    das variveis. Caso haja disperso espacial no uniforme dos valores amostrais,

    pode-se dizer que a varivel tem comportamento anisotrpico. Caso contrrio, o

    comportamento espacial isotrpico.

  • 40

    Uma vantagem da anlise espacial a de que esta mais propcia para lidar

    com a anisotropia, pois representa bem a variabilidade espacial da propriedade em

    estudo. Procedimentos determinsticos para este fim so considerados limitados,

    pois no consideram a estrutura de autocorrelao espacial bem como a anisotropia

    presente (CAMARGO, 2001).

    Diversos tipos de anlises podem ser promovidos de acordo com o tipo do

    dado o qual se trabalha. A Tabela 3.1, adaptada de Druck et al. (2004), ilustra a questo.

    Tabela 3.1: Tipos de dados e problemas em anlise espacial Problemas em anlise

    espacial Tipos de dados Exemplo Aplicaes tpicas

    Anlise de padres pontuais Eventos localizados

    Ocorrncia de doenas

    Determinao de padres e agrupamentos

    Anlise de superfcies Amostras de campo e matrizes Depsitos minerais Interpolao e medidas de

    incerteza

    Anlise de reas Polgonos e atributos Dados censitrios Regresso e distribuies

    conjuntas Fonte: Druck et al., 2004 (adaptado).

    A anlise espacial, em seu carter exploratrio, pode ocorrer de diversas

    maneiras. Em seguida, so citadas representaes de anlise espacial exploratria.

    - Visualizao de Dados: Trata-se da forma mais simples e intuitiva de

    realizar uma anlise espacial. Consiste em considerar valores de corte de maneira a

    identificar valores extremos no espao amostral. Isto , considerando um valor de

    corte propcio a anlise, apenas os valores acima do valor de corte so exibidos em

    uma superfcie espacial (DRUCK et al., 2004).

    - Grficos de Mdias e Medianas: Estes grficos so construdos levando

    em conta as coordenadas geogrficas dos centroides de reas com valores comuns

    de maneira a montar uma matriz de mdias e medianas entre cada par de reas.

    Dessa forma, estes grficos (matrizes) permitem explorar simultaneamente a

    presena de tendncias espaciais. Quando se encontra uma tendncia espacial ao

    longo de alguma direo, os valores dessa matriz variam suavemente, caso

  • 41

    contrrio, para valores muito discrepantes, considera-se a no presena de

    tendncia espacial (DRUCK et al., 2004).

    - Anlise de Autocorrelao Espacial: Esta anlise muito parecida com a

    anterior, alterando apenas a abordagem considerada. Ela visa identificar estrutura

    de correlao espacial pela estimao da magnitude da autocorrelao espacial

    entre as reas. Quando se dispe de um nmero grande de reas, muito provvel

    que existam diferentes regimes de correlao (DRUCK et al., 2004).

    - Semivariograma: O semivariograma uma representao grfica

    indicadora da dependncia espacial atravs do clculo de varincia entre pontos da

    amostra. Nele considerada a associao de um valor nico de atributo a cada

    ponto geogrfico. Atravs dos valores calculados, pode-se descrever dados como

    sendo no-estacionrios quando o semivariograma no se estabiliza, e estacionrios

    quando o semivariograma estabilizado. Os semivariogramas devem ser realizados

    para todas as direes de interesse (DRUCK et al., 2004).

    - Anlises baseadas em estimadores: Algumas vezes conveniente realizar

    a reestimao dos valores do espao amostral, de maneira a suprimir a ausncia de

    dados em determinadas reas ou at mesmo realizar uma suavizao de flutuaes

    aleatrias muito intensas. Para isto, algumas tcnicas so utilizadas. Um exemplo

    a estimativa bayesiana local, que consiste em estimar valores convergindo os dados

    para mdias locais. Aps a estimao, os dados so visualizados como um todo em

    um mapa. Esta tcnica pode ser combinada com as quatro citadas anteriormente

    (DRUCK et al., 2004).

    Enquanto as tcnicas de anlise exploratria descrevem e visualizam dados

    espaciais para a verificao da existncia de padres de associao espacial, as

    tcnicas de anlise confirmatria envolvem o conjunto de modelos de estimao e

    procedimentos para sua validao, geralmente realizados por regresses (KREMPI,

    2004). No entanto, a utilizao dessa ferramenta depende de uma averiguao

    preliminar de existncia de homogeneidade espacial. Caso seja identificada

  • 42

    homogeneidade espacial, podem-se usar modelos globais, caso contrrio, so

    utilizados modelos locais.

    Para o caso de modelos com efeitos espaciais globais, supe-se que

    possvel capturar a estrutura de correlaes espaciais por meio de um nico

    parmetro (varivel), que deve ser adicionado ao modelo de regresso tradicional.

    J para o caso de modelos com efeitos espaciais locais, os coeficientes de

    regresso precisam refletir a heterogeneidade espacial. Para isso conveniente a

    diviso do espao de estudo em subregies, cada uma com seu padro espacial

    prprio (DRUCK et al., 2004). Cada regime das subregies colabora com os seus prprios valores para os coeficientes que iro compor, por exemplo, uma regresso

    geograficamente ponderada, regresso esta que considera que pontos mais

    prximos ao ponto da regio de estudo tm maior influncia nos parmetros

    estimados desta regresso (CARVALHO et al., 2006).

    Dentre estas anlises, baseadas na teoria das variveis regionalizadas

    (MATHERON, 1971), destaca-se a Geoestatstica, tambm conhecida como anlise

    espacial de superfcies, cuja base conceitual anloga. A Geoestatstica

    desempenha papel semelhante s anlises de estatstica espacial descritas

    anteriormente, porm mais rebuscada, pois combina a utilizao de

    semivariogramas experimentais com um poderoso estimador, a Krigagem.

    3.2 GEOESTATSTICA

    O processo de modelagem geoestatstica melhor definido quando

    segregado pelas etapas de: (1) Anlise das variveis regionalizadas; (2) Modelagem

    de semivariogramas experimentais; (3) Validao e (4) Krigagem. Tais etapas so

    descritas nas sees subsequentes.

  • 43

    3.2.1 Anlise das variveis regionalizadas

    Quando um fenmeno distribui-se espacialmente e exibe certa estrutura

    espacial, deve-se dizer que este um fenmeno regionalizado. Haver ento pontos

    do espao com certas caractersticas referentes a este fenmeno. Diz-se ento que

    essas variveis, que descrevem as caractersticas do fenmeno, so denominadas

    variveis regionalizadas (MATHERON, 1971).

    A teoria das variveis regionalizadas, desenvolvida por Matheron, diz que,

    sendo a varivel regionalizada distribuda no espao (ou tempo), esta pode ser vista

    como resultado de uma funo aleatria (processo aleatrio, campo aleatrio ou

    processo estocstico). Esta teoria consolida o alicerce da Geoestatstica

    (CAMARGO et al., 2001).

    A Geoestatstica estuda o comportamento das variveis regionalizadas, que,

    diferentemente das aleatrias, possuem uma distribuio e variao espacial com

    continuidade aparente. A variao espacial de uma varivel regionalizada

    composta de trs componentes (PEREIRA, 2011):

    Componente estrutural no aleatria: associada a um valor mdio

    constante ou uma tendncia constante;

    Componente aleatria: componente espacialmente correlacionada;

    Componente de rudo aleatrio: trata-se do erro residual da varivel

    regionalizada.

    A estrutura espacial de uma varivel regionalizada pode apresentar

    comportamento diferente dependendo da direo de estudo (anisotropia). Dessa

    forma, a anlise e modelagem da estrutura espacial de uma varivel regionalizada

    tem como ferramenta primria o semivariograma (GONALVES et al., 2001; SOUZA et al., 2004).

    A natureza das variveis regionalizadas pode ser de dois tipos: quantitativa e

    qualitativa. As variveis quantitativas podem ser contnuas ou discretas. As variveis

    qualitativas (categricas) podem ser subclassificadas em nominal e ordinal.

  • 44

    3.2.2 Modelagem de semivariogramas experimentais

    O semivariograma condensa as informaes obtidas pelas variveis

    regionalizadas por meio de uma representao grfica em que a ordenada a

    varincia entre pares de observaes () e a abscissa a distncia entre estes pares (h).

    A construo do semivariograma uma etapa da modelagem geoestatstica

    que trata da anlise do comportamento estrutural das variveis regionalizadas. O

    fenmeno espacial avaliado pela mensurao das varincias entre pares de

    pontos. A varincia entre pontos () definida como a diferena quadrtica mdia entre observaes de uma varivel aleatria Z(x), separadas por uma distncia h

    (Equao 3.1).

    h = Z x Z(x + h) 2 (3.1)

    Dessa forma, valores baixos indicam menor variabilidade, ou seja, maior

    similaridade entre as observaes (MELLO, 2004). A funo do semivariograma

    determinada pela metade da mdia das varincias entre os pontos:

    h =1

    2N Z x Z(x + h) 2

    n(h)

    i=1

    (3.2)

    Em que, N nmero total de observaes da amostra em cada lag (h).

    Alguns autores utilizam a terminologia variograma para a modelagem

    geoestatstica. O variograma definido como metade do semivariograma.

    3.2.2.1 Parmetros para definio do semivariograma

    A elaborao de semivariogramas demanda a definio dos seguintes

    parmetros:

  • 45

    Distncia de corte (dcorte): limite superior para clculo do semivariograma. O valor usual metade da maior distncia entre pontos da amostra (LANDIM,

    2004).

    Lag: segmentos delimitados a fim de auxiliar o clculo das varincias entre

    pares de pontos. So definidos os parmetros para o lag ( ):

    o Tamanho do lag (h): distncia mdia entre amostras vizinhas;

    o Nmero de lags (nlags): valor escolhido de maneira que: < para que haja representao completa das amostras;

    o Tolerncia de lag (h): valores dentro dos limites (h + h) e (h - h) so considerados como pertencentes a h.

    Direo angular (): direo adotada para elaborao do semivariograma que

    melhor representa a distribuio espacial dos dados. Deste parmetro,

    definem-se: o Tolerncia angular (): valores dentro dos limites ( + ) e ( - )

    so considerados como pertencentes a . o Direo ortogonal ( + 90): direo ortogonal direo adotada para

    elaborao do semivariograma.

    3.2.2.2 Processo de obteno do semivariograma

    Considera-se o lag de tamanho h com tolerncia h e a direo angular com tolerncia angular ; nlags o nmero de lags, N=[n1, n2, n3,... nN] o nmero total de amostras; e dcorte a distncia de corte.

    1) O processo tem incio em um primeiro ponto n1 da amostra. Para toda observao distante h h e com ngulo entre deste ponto, calcula-se a diferena entre os valores dos pares (Figura 3.1);

  • 46

    Figura 3.1: Etapa 1) para processo de obteno do semivariograma experimental.

    2) Refaz-se o passo 1) para todas as N amostras (Figura 3.2);

    Figura 3.2: Etapa 2) para processo de obteno do semivariograma experimental.

    3) Obtm-se a varincia para o lag de tamanho h. Este valor estar representado

    por um dos pontos no semivariograma experimental, onde o eixo y representado

    pela varincia e o eixo x pela distncia h (Figura 3.3);

    Figura 3.3: Etapa 3) para processo de obteno do semivariograma experimental.

    4) Repete-se os passos de 1) at 3) para os lags 2h, 3h, , nlags*h, afim de se obter

    (2h), (3h), , (nlags*h), desde que os valores de distncia no excedam a distncia de corte (dcorte), conforme Figura 3.4.

  • 47

    Figura 3.4: Etapa 4) para processo de obteno do semivariograma experimental.

    3.2.2.3 Interpretao grfica do semivariograma

    Os parmetros grficos do semivariograma podem ser observados na Figura

    3.5. O alcance ou amplitude (a) a distncia em que as amostras se apresentam

    correlacionadas espacialmente. Desta distncia em diante, considera-se que no

    existe mais dependncia espacial entre as amostras, porque a varincia entre pares de amostras no se altera com a distncia h (CAMARGO, 1998). O patamar

    (C) o valor do eixo de varincia correspondente ao alcance (a).

    medida que h tende a zero, a varincia se aproxima de um valor que revela a descontinuidade do semivariograma para distncias menores do que a

    distncia mdia entre as amostras. Este valor definido como efeito pepita (Co). O

    efeito pepita representa a incerteza pequena escala, como tambm a alta

    variabilidade da varivel em distncias pequenas (SOARES, 2006). Podem ocorrer

    tambm casos onde o efeito pepita seja nulo, ou seja, so identificadas varincias

    nulas entre pontos a curtas distncias (h 0). Quando existente, esta

    descontinuidade junto origem pode ocorrer devido a erros de medio ou

  • 48

    inconstncia de variveis (SOUSA e MUGE, 1990). O efeito pepita pode ser devido

    : i) possvel existncia de erros de amostragem e ii) microrregionalizaes no

    perceptveis escala de anlise.

    O patamar (sill), observado na Figura 3.5 mede a varincia do espao amostral. O sill pode ser definido como a varincia terica dos dados ou, conforme Leung (2002) pode ser substitudo pela mdia entre as varincias experimentais

    (mdia dos pontos de varincia ).

    A contribuio (C1) a diferena entre o patamar (C) e o efeito pepita (C0).

    Figura 3.5: Parmetros para interpretao grfica do semivariograma.

    O comportamento espacial isotrpico da varivel (Figura 3.6 (a)) justifica a

    escolha de um semivariograma omnidirecional (CORREIA, 2010). Caso contrrio,

    para anisotropia (efeito de direo), deve-se examinar semivariogramas para

    diversas direes de variabilidade espacial. Na anisotropia (Figura 3.6 (b)), a funo

    do semivariograma varia de acordo com a direo (YAMAMOTO e LANDIM, 2013).

    De modo contnuo, a variabilidade dos dados acontece em uma dada direo

    particular (SOARES, 2006). A direo principal refere-se ao ngulo de mxima

    variabilidade espacial dos dados, no exemplo de anisotropia da Figura 3.6 (b), a

    direo principal visualizada como = - 45.

  • 49

    Isotropia Espacial (a) Anisotropia Espacial (b)

    Figura 3.6: Representao de uma varivel espacial isotrpica (a) e anisotrpica (b).

    A anisotropia representada por dois tipos principais: geomtrica e zonal.

    Segundo Soares (2006), a anisotropia geomtrica um modelo no qual a

    continuidade espacial, denunciada pelas amplitudes dos semivariogramas, varia da

    direo de maior continuidade (amplitude) direo de menor amplitude,

    perpendicular quela, de um modo gradual segundo a equao da elipse no plano

    daquelas duas direes. Dessa forma, os semivariogramas de dados com estrutura

    anisotrpica geomtrica se caracterizam pela existncia de um nico patamar e

    amplitudes diferentes. No entanto, dados espaciais com anisotropia zonal

    apresentam patamares diferentes, conforme direo analisada, mas todos sob um

    mesmo alcance (YAMAMOTO e LANDIM, 2013).

    3.2.2.4 Ajuste do semivariograma experimental

    O ajuste de semivariogramas experimentais realizado de acordo com

    modelos tericos, conforme Figura 3.7.

  • 50

    Cbico

    Esfrico

    Exponencial

    Gaussiano

    Pentaesfrico

    Lei de Potncia

    Efeito Senoidal

    Figura 3.7: Exemplos de melhores ajustes para semivariogramas experimentais. Fonte: OLEA (2006).

    Os modelos tericos podem ser para um semivariograma cbico, esfrico,

    exponencial, gaussiano, pentaesfrico, lei de potncia e efeito senoidal. Embora as

    sete curvas sejam convenientes a modelos de ajuste, as trs curvas mais utilizadas

    na literatura so: exponencial, esfrica e gaussiana, cujas expresses esto

    representadas nas Equaes 3.3, 3.4 e 3.5, respectivamente (OLEA, 2006).

    - Exponencial:

    Ex h = C 1 e3h a (3.3)

  • 51

    - Gaussiano:

    G h = C 1 e3 h a

    2

    (3.4)

    - Esfrico:

    Sp h = C 3h2a

    12 h

    a

    3 , 0 h < |a|

    C, a |h|

    (3.5)

    A correta elaborao de semivariogramas experimentais e a qualidade do

    ajuste so fundamentais para a etapa de Krigagem.

    3.2.3 Validao

    O processo de validao uma das etapas de obteno de um modelo que

    represente de forma adequada a realidade. Kramer (1998) desenvolve em seu

    estudo um esquema bsico que deve ser seguido durante o processo de escolha de

    um modelo representativo mais adequado. A Figura 3.8 ilustra o esquema.

    Figura 3.8: Fluxograma para abordagem bsica de calibrao e validao de modelos.

    Fonte: Kramer,1998 (traduzido e adaptado).

  • 52

    O uso de dados adequados pesquisa pode parecer algo intrnseco, porm

    no um passo trivial. Muitos fatores influenciam a adequabilidade dos dados, tais

    como nmero de amostras destinadas ao conjunto de calibrao e validao,

    preciso dos dados utilizados na calibrao. Entretanto, apenas aps realizar os

    passos seguintes que muitas vezes problemas so evidenciados e por isso que,

    de acordo com o esquema, sempre possvel o retorno ao passo inicial aps

    aprimoramento de acordo com as necessidades.

    Dos passos do esquema, a construo dos modelos o mais simples.

    Atravs de adventos computacionais modernos, vrios pacotes computacionais

    permitem a manipulao de uma grande quantidade de dados a fim de estabelecer

    procedimentos que possibilitem a extrao de informaes relativas aos objetos de

    estudo. Esta etapa nomeada calibrao e realizada utilizando uma parte dos

    dados originais destinada apenas para esse propsito.

    O passo seguinte consiste em testar os modelos implementados no passo

    anterior. A melhor forma de averiguar se uma calibrao foi feita de maneira errnea

    por meio de um conjunto de testes. Esse conjunto de testes, denominado

    validao, realizado com a parcela de dados complementar utilizada na

    calibrao. Para tal, considera-se que essas amostras de validao sejam

    desconhecidas e, utilizando a calibrao prvia, tenta -se estimar seus valores. A

    seguir, os valores previstos so comparados com os valores conhecidos para essas

    amostras. Dessa forma, com o objetivo de avaliar a qualidade do mtodo

    estabelecido, medidas de erro entre as previses e os valores observados so

    mensuradas.

    Posterior calibrao e validao dos modelos criados, pode-se escolher o

    modelo que melhor atendeu s expectativas. Entretanto, este modelo deve ser

    usado com cautela, pois contempla apenas fatores envolvidos nas condies

    propostas. Isso quer dizer que, para o conjunto de dados em questo, o melhor

    modelo escolhido pode ser uma boa representao da realidade nas condies de

    tempo e espao estabelecidas. Dessa forma, o modelo deve ser usado com certo

  • 53

    nvel de ceticismo uma vez que o evento modelado possa ser submetido a diferentes

    fatores externos dos estabelecidos inicialmente.

    De maneira a suprimir eventuais inadequaes provenientes de novas

    condies, a etapa seguinte estabelece que o modelo possa sofrer alteraes e

    aprimoramentos a fim de se adaptar a possveis necessidades futuras.

    Para a Geoestatstica, as etapas do esquema apresentado so igualmente

    vlidas. Um dos fatores que influencia a adequabilidade dos dados, alm do nmero

    de elementos da amostra, a correta escolha da varivel de estudo. A escolha dos

    dados deve contemplar o uso de variveis regionalizadas, pois estas so

    fundamentais no processo de construo de semivariogramas.

    O processo de ajustes dos semivariogramas identifica a direo principal de

    tendncia dos dados utilizados. Atravs do semivariograma relativo direo

    principal, o modelo de calibrao estabelecido por meio do processo de Krigagem.

    A verificao da qualidade da modelagem geoestatstica realizada por

    validao. Nesta etapa, quantificado o erro e a varincia dos resduos a partir dos

    valores observados e estimados nas coordenadas de valores conhecidos das

    variveis. Para o tamanho do conjunto de validao, em geral utiliza-se um nmero

    igual a 30% do total de elementos da amostra (LUZ, 2003).

    Um procedimento de validao utilizado com frequncia na Geoestatstica o

    teste do ponto fictcio (validao cruzada). Este teste consiste em subdividir o

    conjunto de dados destinados validao em grupos de mesmo tamanho. Cada

    grupo usado individualmente como teste, enquanto os outros so usados para

    calibrao. Quando um grupo usado como teste, apesar de se conhecer os valores

    a priori, assume-se esses valores como sendo desconhecidos. Ento, tenta-se estimar os valores deste grupo atravs da calibrao feita pelos grupos

    complementares. O processo se repete at que todos os grupos tenham passado

    pelo processo de validao. Esta tcnica interessante, pois, diferente da validao

    convencional, evita a superposio dos conjuntos de teste. A validao cruzada

    adotada por este trabalho define grupos unitrios.

  • 54

    3.2.4 Krigagem

    A Krigagem um dos mtodos de estimativa utilizada na Geoestatstica. A

    teoria foi desenvolvida a partir do trabalho do seu inventor Daniel G. Krige. Trata-se

    de um processo de predio linear, pois suas estimativas so combinaes lineares

    ponderadas por dados existentes. A Krigagem fornece, em geral, estimativas no

    tendenciosas e com varincia mnima (LANDIM, 2003).

    A Krigagem difere-se de outros interpoladores, pois parte do pressuposto

    que pontos prximos no espao tendem a ter valores mais parecidos do que pontos

    afastados. Esse pressuposto garantido por uma ponderao intrnseca ao mtodo.

    A partir das curvas ajustadas de semivariogramas do espao amostral,

    valores de efeito pepita (Co), contribuio (C1) e amplitude (a) so utilizados para a

    definio de pesos W (ponderadores). A funo dos ponderadores a de ditar a

    influncia dos dados amostrais na estimao de novos valores. O estimador de

    Krigagem dado pela Equao 3.6.

    Z(x0) = i Z(xi )n

    i=1

    (3.6)

    O sistema de Krigagem constitudo por ponderadores com o objetivo de

    conduzir estimativas a erros nulos (no enviesamento universal) e minimizao da

    varincia (otimizao):

    = G 1 M (3.7)

    Os ponderadores do estimador de Krigagem resumem dois fatores: 1) o fator

    de distncia estrutural entre amostras e o ponto a estimar; 2) o fator desagregao

    originado pela matriz de covarincias entre as amostras, ou seja, quanto mais

    correlacionadas estiverem, maior a redundncia e menor ser o peso individual na

    construo do estimador (SOARES, 2006). A soluo para os ponderadores da

    Krigagem Ordinria dada pelas representaes matriciais:

  • 55

    ,

    ,

    .

    Os ponderadores de Krigagem so considerados dentro de uma rea de

    atuao estabelecida por um elipside de raios determinados pelas amplitudes da

    direo principal e ortogonal.

    As formas mais usuais de Krigagem so a Krigagem Simples (KS) e a

    Ordinria (KO). A KS utilizada quando a mdia assumida como estatisticamente

    constante para toda rea de abrangncia das amostras. J a KO, por sua vez,

    considera a mdia flutuante ou mvel por toda rea.

    As varincias de Krigagem no so normalmente medidas de acurcia de

    estimativa local. Para satisfazer esta necessidade, uma das solues a Krigagem

    Indicativa (KI). Na KI, o enfoque passa a ser o de definir reas com maior ou menor

    probabilidade de ocorrncia de um determinado evento. Diferentemente da KO,

    onde o enfoque a estimao de um determinado valor. Neste trabalho, o

    interpolador utilizado a KI, descrita na subseo seguinte.

    3.2.4.1 Krigagem Indicativa (KI)

    A KI consiste basicamente na aplicao da KO para variveis transformadas,

    ou seja, a varivel resultante da aplicao da funo no linear f(x) =0 ou f(x)=1. O

    conceito inicial foi apresentado como proposta para construo de uma funo de

    distribuio de probabilidades acumuladas para estimativa de distribuies espaciais

    (LANDIM e STURARO, 2002).

  • 56

    O primeiro passo da KI consiste em transformar os dados iniciais em

    indicadores, isto , transformar valores que esto acima de um determinado valor de

    corte em 0 e os que esto abaixo em 1.

    ij(vc) 1, se vj vc 0, se vj >vc

    Onde vc o nvel de corte e vj o valor observado. Os passos seguintes so

    anlogos KO, porm aplicados aos dados transformados.

    A frequncia acumulada dos valores observados abaixo do nvel de corte

    representada por:

    F(vc) =1n ijvc

    n

    j=1

    (3.6)

    De maneira anloga, a proporo de valores abaixo do nvel de corte pode

    tambm ser considerada como a mdia ponderada dos indicadores situados na

    vizinhana do local avaliado segundo:

    F (vc) = wj ijvc

    n

    j=1

    (3.7)

    Sendo wj os pesos, ij os indicadores e vc o nvel de corte.

    Em posse das frequncias acumuladas, da proporo de valores e de

    semivariogramas experimentais, so calculadas as probabilidades para

    determinados locais da rea amostral (LIMA et al., 2008).

    No presente trabalho, a varivel objeto de estudo escolhida no uma

    varivel contnua transformada de probabilidade, mas sim, uma varivel discreta

    relativa escolha de modo motorizado, conforme descrito no captulo posterior.

  • 57

    3.2.5 Geoestatstica e Transportes

    A proposta de utilizao da Geoestatstica na Engenharia de Transportes

    ainda incipiente. Alguns trabalhos, como os de Braxmeier et al. (2005) e Du e Aultman-Hall (2006) deram incio aos estudos na rea de Engenharia de Trfego. O

    conhecimento da anlise espacial de Geoestatstica, no campo de modelagem de

    demanda por transportes, ainda requer muitos conhecimentos bsicos,

    principalmente acerca das variveis, que encontram obstculos por envolverem

    questes de comportamento humano. Alguns trabalhos provenientes do estudo da

    Geoestatstica na rea de demanda por transportes so mencionados a seguir.

    Teixeira (2003) relacionou aspectos socioeconmicos gerao de viagens

    atravs da Geoestatstica. Neste trabalho, foi aplicada a Krigagem Ordinria para a

    apresentao de uma metodologia para definir o zoneamento por reas

    homogneas relacionadas ao planejamento de transportes por meio de aspectos

    econmicos e de viagens da populao atravs dos setores censitrios.

    Pitombo e Sousa (2009) aplicaram conceitos geoestatsticos para analisar

    gerao de viagens urbanas por modo de transporte e motivo de viagem. No

    trabalho, em que foram utilizadas as tcnicas de Krigagem Ordinria e um banco de

    dados agregado por Zona de Trfego, estimou-se as variveis para 40.000 pontos.

    No trabalho de Pitombo et al. (2010b) e Pitombo et al. (2014) tambm foram previstos dados de gerao de viagens de dados agregados pela Geoestatstica,

    contudo, foi utilizada, alm da Krigagem Ordinria, a Krigagem com Deriva Externa.

    Miura (2010) descreveu, em seu estudo, uma abordagem para estimao de

    tempo de viagem, atravs de Krigagem Ordinria. Os resultados demonstraram que

    as propriedades geoestatsticas de dados de tempo de viagem so to favorveis

    quanto os dados de malha viria.

    Costa et al. (2013) estimaram a probabilidade da escolha modal atravs da Geoestatstica por meio de dados desagregados, utilizando tcnicas de rvore de

    Deciso e Krigagem Ordinria.

  • 58

    Pitombo et al. (2015) propuseram um mtodo de duas etapas para a estimao da escolha modal, atravs de um banco de dados domiciliar na cidade

    de So Carlos. Foram selecionados os atributos que mais influenciam na

    escolha modal por meio de rvore de Deciso e aps a comparao da eficcia da

    rvore de Deciso com um Modelo Multinomial Logstico, realizou-se uma Krigagem

    Ordinria para prever a escolha modal, a partir da localizao espacial.

    Rocha (2014) analisou a gerao de viagens urbanas por transporte coletivo

    atravs da Geoestatstica, por meio de Krigagens Ordinria e com Deriva Externa

    em um banco de dados agregado referente Regio Metropolitana de Salvador.

    Rocha et al. (2014) propuseram uma tentativa inicial de melhorar a modelagem Geoestatstica a partir de dados muito agregados, sabendo que , muitas

    vezes, apenas estes esto disponibilizados e que, no entanto, a Geoestatstica

    manipula melhor dados contnuos no espao.

  • 59

    4. MATERIAIS E MTODO

    Uma vez que nos captulos 2 e 3 foi discutido o referencial terico necessrio para o entendimento das atividades deste trabalho, o capitulo 4 descreve os materiais e o mtodo. Foram utilizados como banco de dados a Pesquisa Origem/Destino da rea de estudo explanada a seguir e como pacotes computacionais: o IBM SPSS 22, o ESRI ArcGIS Platform 10.1, e o GeoMS 1.0. As etapas metodolgicas tambm so descritas, posteriormente aos materiais.

    4.1 MATERIAIS

    4.1.1 Banco de dados e rea de estudo

    Os dados utilizados neste trabalho so referentes Pesquisa Origem/Destino

    (O/D) realizada na Regio Metropolitana de So Paulo (RMSP) em 2007 pela

    Companhia do Metropolitano de So Paulo. Na RMSP esto contidas 460 Zonas de

    Trfego em 39 municpios (Figura 4.1). O Anexo 01 apresenta o mapa com a

    denominao de todos os municpios da RMSP.

    Figura 4.1: Regio Metropolitana de So Paulo e Zonas de Trfego.

    Fonte: Metr (2007)

    Municpio de So Paulo

  • 60

    A Pesquisa O/D fornece dados para o conhecimento da natureza dos

    deslocamentos da populao, identificando as principais viagens dirias, conforme

    motivo e modo de transporte. A lm disso, a Pesquisa O/D permite estabelecer

    relaes quantitativas entre as viagens realizadas e outras variveis, como

    caractersticas socioeconmicas da populao e aspectos de ocupao urbana, de

    forma a estabelecer projees futuras das necessidades de viagens das pessoas.

    Na Pesquisa O/D da RMSP de 2007 foram levantadas informaes de 30 mil

    domiclios (Figura 4.2), escolhidos aleatoriamente e distribudos nas 460 Zonas de

    Trfego na RMSP (Figura 4.1). A distncia entre o par de domiclios mais afastados

    entre si de aproximadamente 142 quilmetros, enquanto a mdia entre os pares

    de domiclios mais prximos de 146 metros.

    Figura 4.2: Representao dos domiclios apurados na Pesquisa O/D da RMSP (2007).

    A RMSP possui uma populao de 19,8 milhes de habitantes (IBGE, 2010)

    na rea de 7.946 km. A Tabela 4.1 apresenta as informaes relacionadas aos

    municpios da RMSP e aos domiclios da Pesquisa O/D. Observa-se que a maior

    quantidade de domiclios entrevistados (Pesquisa O/D) est representada pelos

    municpios de So Paulo, Osasco, Santo Andr, Mogi das Cruzes e Guarulhos.

    Estes municpios so os municpios mais populosos, no entanto, estes no

    condizem com as respectivas maiores reas ou densidades.

  • 61

    Tabela 4.1: Informaes dos municpios da RMSP Cd Municpio Domiclios* Habitantes** rea** km

    Densidade hab/km

    36 So Paulo 77,25% 11.253.503 1521,11 7.398 24 Osasco 2,52% 666.740 64,954 10.265 32 Santo Andre 2,08% 676.407 175,782 3.848 23 Mogi das Cruzes 2,04% 387.779 712,541 544 15 Guarulhos 2,03% 1.221.979 318,675 3.835 33 So Bernardo do Campo 1,54% 765.463 409,508 1.869 34 So Caetano do Sul 1,01% 149.263 15,331 9.736 2 Barueri 0,97% 240.749 65,701 3.664 22 Mau 0,86% 417.064 61,909 6.737 6 Carapicuiba 0,79% 369.584 34,546 10.698 27 Ribeiro Pires 0,71% 113.068 99,075 1.141 7 Cotia 0,66% 201.150 323,994 621 37 Suzano 0,65% 262.480 206,236 1.273 8 Diadema 0,61% 386.089 30,756 12.553 9 Embu das Artes 0,55% 240.230 70,398 3.412 18 Itaquaquecetuba 0,48% 321.770 82,622 3.894 19 Jandira 0,42% 108.344 17,449 6.209 11 Ferraz de Vasconcelos 0,39% 168.306 29,564 5.693 26 Po 0,39% 106.013 17,264 6.141 28 Rio Grande da Serra 0,38% 43.974 36,341 1.210 38 Taboo da Serra 0,38% 244.528 20,388 11.994 10 Embu-Guacu 0,33% 62.769 155,641 403 5 Cajamar 0,30% 64.114 131,386 488 17 Itapevi 0,29% 200.769 82,658 2.429 31 Santana de Parnaiba 0,26% 108.813 179,949 605 12 Francisco Morato 0,23% 154.472 49,001 3.152 13 Franco da Rocha 0,23% 131.604 132,775 991 1 Aruj 0,21% 74.905 96,167 779 39 Vargem Grande Paulista 0,21% 42.997 42,489 1.012 16 Itapecerica da Serra 0,17% 152.614 150,742 1.012 21 Mairipor 0,16% 80.956 320,697 252 35 So Lourenco da Serra 0,16% 13.973 186,456 75 30 Santa Isabel 0,15% 50.453 363,332 139 3 Biritiba-Mirim 0,14% 28.575 317,406 90 25 Pirapora do Bom Jesus 0,14% 15.733 108,489 145 20 Juquitiba 0,13% 28.737 522,169 55 29 Salesopolis 0,09% 15.635 424,997 37 14 Guararema 0,07% 25.844 270,816 95 4 Caieiras 0,02% 86.529 97,642 886

    *Informao obtida pela proporo de domiclios entrevistados pela Pesquisa O/D (2007). **Informao obtida pelo censo 2010 (IBGE). Obs: Em verde esto representados os cinco menores valores para cada atributo e em vermelho os cinco maiores valores.

  • 62

    4.1.2 Software

    Os resultados obtidos neste trabalho de mestrado valeram-se de um conjunto

    de ferramentas computacionais, que auxiliaram em diversos campos, tais como:

    anlises estatsticas tradicionais, anlise espacial e modelagem geoestatstica

    aplicadas ao campo da Engenharia de Transportes.

    No mbito das estatsticas tradicionais, clculos como o de regresso e testes

    de qualidade (chi-quadrado, taxa de acertos) foram realizados atravs do software IBM SPSS Statistics 22.

    Com relao anlise espacial, os sistemas de informao geogrfica (SIGs)

    provm ferramental necessrio para o estabelecimento da visualizao de dados por

    meio de mapas. A gerao de superfcie espacial foi realizada pelo software ESRI ArcGIS Platform, verso 10.1.

    No campo da Geoestatstica, as etapas de visualizao estatstica dos

    dados, gerao de semivariogramas experimentais, ajuste por curvas tericas,

    interpolao por Krigagem e validao cruzada (teste do ponto fictcio) foram obtidas

    atravs do software GeoMS 1.0, desenvolvido pelo Centro de Modelizao de Reservatrios Petrolferos (CMRP-Portugal).

    4.2 MTODO

    O processo metodolgico adotado se baseia nas etapas ilustradas na Figura

    4.3 e descritas na sequncia.

    Figura 4.3: Esquema simplificado do mtodo proposto.

  • 63

    4.1.1 Tratamento e visualizao de dados

    Os dados desagregados originalmente apresentavam 196.698 registros, em

    que cada registro representava uma viagem da Pesquisa Origem/Destino. Em se

    tratando de um estudo espacial, torna-se necessrio que as informaes estejam

    vinculadas a coordenadas geogrficas. Como o estudo das viagens isoladas no

    representa um espao, o mtodo visou transformao do banco de dados

    relacionados a viagens para informaes atreladas aos domiclios.

    Por se tratar de um banco de dados referente Pesquisa O/D, observou-se

    que havia casos em que coordenadas geogrficas estavam associadas a mais de

    um domiclio. Como uma das suposies da Geoestatstica sugere que cada

    elemento do espao tenha representao nica, houve necessidade da adoo de

    um valor singular para cada elemento de espao. Dessa forma, para cada caso de

    coordenada geogrfica repetida, sorteou-se (atravs de pseudoaleatoriedade

    baseada em semente temporal) um domiclio para sua representao espacial.

    As informaes de interesse para este projeto esto descritas na Tabela 4.2,

    juntamente com as suas naturezas. Originalmente, a Pesquisa O/D indica os modos

    realizados para cada viagem. Neste trabalho, como cada linha de viagem tem suas

    informaes compiladas em informaes/domiclios, a varivel de modo de viagem de cada linha do banco de dados foi transformada em variveis de proporo (%) de viagens por modo.

    Os modos de transporte foram classificados como: Transporte Individual

    Motorizado, Transporte no Motorizado e Transporte Pblico. O Transporte

    Individual Motorizado inclui viagens em que o indivduo dirige automvel ou

    motocicleta. O Transporte no Motorizado refere-se ao uso de bicicleta e modo a p.

    O Transporte Pblico inclui viagens por nibus do municpio de So Paulo, nibus

    de outros municpios, nibus metropolitano, micronibus do municpio de So Paulo,

    micronibus de outros municpios, micronibus metropolitano, metr e trem.

  • 64

    Tabela 4.2: Informaes utilizadas da Pesquisa O/D RMSP 2007. Informaes por domiclio Natureza Coordenada geogrfica x (*) UTM

    Coordenada geogrfica y (*) UTM Zona Qualitativa

    Municpio Qualitativa

    Nmero de pessoas (**) Quantitativa Discreta Critrio de renda (**) Qualitativa

    Quantidade de automveis (**) Quantitativa Discreta

    Quantidade de motocicletas (**) Quantitativa Discreta Quantidade de bicicletas (**) Quantitativa Discreta

    Nmero total de viagens (*) (**) Quantitativa Discreta

    % de viagens por transporte individual motorizado (*) Quantitativa Cont nua % de viagens por transporte no motorizado (*) Quantitativa Cont nua

    % de viagens por transporte pblico (*) Quantitativa Cont nua

    Distncia total de viagens (*) (**) Quantitativa Cont nua Distncia por transporte individual motorizado (*) (**) Quantitativa Cont nua

    Distncia por transporte no motorizado (*) (**) Quantitativa Cont nua

    Distncia por transporte pblico (*) (**) Quantitativa Cont nua Preferncia por modo motorizado (*) (**) Categrica Dicotmica

    (*) Varivel avaliada para a determinao da varivel objeto de estudo na anlise de estrutura espacial. (**) Varivel utilizada para a modelagem tradicional.

    A varivel preferncia por modo motorizado originalmente no consta nos dados da Pesquisa O/D. Esta varivel foi inserida com o intuito de prover

    informaes complementares ao estudo e suavizar possveis efeitos de

    microrregionalizaes inerentes s preferncias modais/domiclio, principalmente no

    caso de viagens no motorizadas. Dessa forma, para esta varivel, foi necessrio

    um tratamento adicional. Este consistiu da transformao da varivel de proporo de viagens por transporte pblico e por transporte individual motorizado em uma varivel categrica, em que:

    Proporo de viagens por Transporte Pblico >Transporte Individual Motorizado 1

    Proporo de viagens por Transporte Individual Motorizado > Transporte Pblico 0

    Esta varivel caracteriza a preferncia entre o modo de transporte pblico e

    modo individual motorizado nos domiclios da RMSP. Portanto, foram eliminados os

  • 65

    casos em que a proporo de viagens por transporte pblico foi igual proporo por transporte individual motorizado. Devido a esta etapa de eliminao, esta varivel tem um nmero de registros menores do que as demais variveis.

    A Tabela 4.3 apresenta a caracterizao das variveis quantitativas atravs

    das medidas descritivas de mdias, desvios padro, modas, mnimos e mximos.

    Tabela 4.3: Medidas descritivas para as variveis quantitativas.

    Informaes por domiclio mdia desvio padro moda mnimo mximo

    Nmero de pessoas 3,3 1,6 3 1 24 Quantidade de automveis 0,9 0,9 1 0 8 Quantidade de motocicletas 0,1 0,3 0 0 9

    Quantidade de bicicletas 0,5 0,9 0 0 12 Nmero total de viagens 6,8 4,6 2 1 68

    % de viagens por transporte individual motorizado 27% 32% 0% 0% 100% % de viagens por transporte no motorizado 17% 24% 0% 0% 100%

    % de viagens por transporte pblico 33% 32% 0% 0% 100% Distncia total de viagens (km) 38,4 34,5 7,2 0,0016 427,1

    Distncia por transporte individual motorizado (km) 12,1 19,9 0,0 0,0000 273,0 Distncia por transporte no motorizado (km) 2,0 7,5 0,0 0,0000 124,5

    Distncia por transporte pblico (km) 19,8 27,5 0,0 0,0000 423,9

    A Tabela 4.4 apresenta o percentual de observaes para a caracterizao

    da varivel qualitativa critrio de renda .

    Tabela 4.4: Percentual de observaes da varivel critrio de renda. Critrio de Renda (Classes)

    1 (A1) 2 (A2) 3 (B1) 4 (B2) 5 (C1) 6 (C2) 7 (D) 8 (E)

    3,0% 11,7% 17,3% 24,3% 23,2% 14,4% 5,7% 0,4%

    A Tabela 4.5 apresenta o percentual de observaes para a varivel

    categrica dicotmica preferncia por modo motorizado .

    Tabela 4.5: Percentual de observaes da varivel preferncia por modo motorizado. Preferncia por modo motorizado

    0 1 Transporte individual motorizado Transporte pblico

    44,8% 55,3%

  • 66

    Devido ao tratamento diferenciado entre a varivel de preferncia por modo motorizado e as demais, este trabalho possui uma amostra considerando a varivel dicotmica (preferncia por modo motorizado) e uma amostra considerando as demais variveis, cujo nmero de registros superior ao da primeira.

    4.1.2 Escolha da varivel objeto de estudo

    A escolha da varivel objeto de estudo se deu pela anlise univariada dos

    dados. Atentou-se para a escolha de uma varivel que se adequasse melhor

    estatstica espacial.

    Com o objetivo de analisar o comportamento da varivel e as tendncias

    espaciais, a elaborao de mapas temticos pontuais para as nove variveis no se

    mostra como alternativa vivel, pois a grande quantidade de pontos (domiclios) faz

    com que as informaes se sobreponham. Dessa forma, a anlise univariada para

    cada caso especfico de varivel foi considerada.

    As nove variveis relativas demanda de transporte analisadas foram:

    proporo de viagens por modo de transporte (3), distncia total de viagens (1), total de viagens por domiclio (1), distncia de viagens por modo de transporte (3) e preferncia por modo motorizado (1).

    4.1.3 Modelagem de demanda por transportes

    Posterior definio da varivel de demanda mais adequada s suposies

    de anlise espacial, os dados passaram pelas etapas de modelagem geoestatstica

    e de modelagem tradicional, com o intuito de obter as estimaes das variveis para

    coordenadas de valores conhecidos. Assim, tornou-se possvel a realizao de

    anlises comparativas. Os processos de modelagem da varivel de demanda

    escolhida (objeto de estudo) podem ser observados na Figura 4.4.

  • 67

    Figura 4.4: Processo de calibrao/validao pela abordagem geoestat stica e tradicional.

    A amostra foi separada em duas partes: a primeira parte (70%), reservada

    para calibrao dos dados e a segunda (30%), para validao. Tais propores de

    subamostras foram utilizadas para ambas as abordagens. A escolha da razo 70/30

    foi emprica. No entanto, no h uma proporo padro para estipular os tamanhos

    dos conjuntos de calibrao e validao. Valores comuns para a razo so: 60/40,

    70/30, 80/20. importante salientar que a diviso deve ser feita de maneira

    randmica e a maior proporo deve ser para o conjunto de calibrao.

    4.1.3.1 Modelagem geoestatstica

    O processo de modelagem geoestatstica segue os passos de: i) Anlise da

    estrutura espacial, ii) Krigagem, iii) Validao.

    i) Anlise da estrutura espacial

    A anlise da estrutura espacial realizada pela elaborao de

    semivariogramas experimentais e posterior ajuste por curvas tericas (esfrica,

    exponencial, gaussiana), o qual permite a identificao da direo principal.

    Com o objetivo de analisar as tendncias espaciais, a elaborao de mapas

    temticos pontuais no se mostra como alternativa vivel, pois a grande quantidade

  • 68

    de pontos (domiclios) faz com que as informaes se sobreponham. Assim sendo,

    semivariogramas experimentais foram calculados. Os semivariogramas demonstram

    graficamente a variabilidade espacial, alm disso, esta informao torna-se

    mensurvel.

    Calculou-se o semivariograma para o caso omnidirecional, considerando,

    dessa forma, uma tolerncia de 180. Entretanto, uma abordagem exclusivamente

    omnidirecional seria vlida apenas para casos de isotropia. Os casos de anisotropia

    demandam a definio da direo preferencial dos dados. Considerando a

    possibilidade de anisotropia da varivel, os semivariogramas foram obtidos tambm

    para ngulos de teste variando de 15 e adotando uma tolerncia de 1.

    O clculo dos semivariogramas teve incio com a escolha do tamanho de lag

    para cada uma das direes realizadas no estudo. Utilizou-se para o caso

    omnidirecional um tamanho de lag obtido pela mdia da distncia euclidiana entre

    vizinhos prximos considerando todas as direes angulares. Para os demais

    semivariogramas, uti lizou-se a mdia da distncia euclidiana para cada uma das

    direes angulares estudadas.

    Posteriormente elaborao, foram investigados os parmetros dos

    semivariogramas experimentais. A investigao intencionou a identi ficao de

    caractersticas para semivariogramas com indcios de um bom ajuste:

    Menor efeito pepita;

    Adequabilidade a curvas tericas (esfrica, exponencial, gaussiana);

    Maiores valores para a razo de amplitude entre os pares de direo.

    Quando satisfeitos, estes parmetros indicam semivariogramas com maiores

    tendncias espaciais. Por meio desta anlise geoestatstica, os resultados

    apontaram a direo principal de estudo.

    A partir de todos os semivariogramas, avaliou-se a estrutura espacial para

    realizao dos passos de ajuste e definio dos parmetros grficos. O patamar foi