UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE...

81
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG DATA NA PROMOÇÃO DA MOBILIDADE SUSTENTÁVEL: APLICAÇÃO DA ANÁLISE DE COMPONENTES PRINCIPAIS PARA ESTIMAÇÃO DE PADRÕES DE COMPORTAMENTO DE USUÁRIOS DO APLICATIVO BIKLIO EDUARDO RAID RODRIGUES 2020

Transcript of UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE...

Page 1: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

UNIVERSIDADE FEDERAL DO RIO DE JANEIRO

USO DE BIG DATA NA PROMOÇÃO DA MOBILIDADE SUSTENTÁVEL:

APLICAÇÃO DA ANÁLISE DE COMPONENTES PRINCIPAIS PARA

ESTIMAÇÃO DE PADRÕES DE COMPORTAMENTO DE USUÁRIOS DO

APLICATIVO BIKLIO

EDUARDO RAID RODRIGUES

2020

Page 2: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

USO DE BIG DATA NA PROMOÇÃO DA MOBILIDADE SUSTENTÁVEL:

APLICAÇÃO DA ANÁLISE DE COMPONENTES PRINCIPAIS PARA

ESTIMAÇÃO DE PADRÕES DE COMPORTAMENTO DE USUÁRIOS DO

APLICATIVO BIKLIO

EDUARDO RAID RODRIGUES

Projeto de Graduação apresentado ao curso de Engenharia Civil da Escola Politécnica, Universidade Federal do Rio de Janeiro, como parte dos requisitos necessários à obtenção do título de Engenheiro.

Orientador: Matheus Henrique de Sousa Oliveira

RIO DE JANEIRO

Março de 2020

Page 3: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

USO DE BIG DATA NA PROMOÇÃO DA MOBILIDADE SUSTENTÁVEL:

APLICAÇÃO DA ANÁLISE DE COMPONENTES PRINCIPAIS PARA

ESTIMAÇÃO DE PADRÕES DE COMPORTAMENTO DE USUÁRIOS DO

APLICATIVO BIKLIO

Eduardo Raid Rodrigues PROJETO DE GRADUAÇÃO SUBMETIDO AO CORPO DOCENTE DO CURSO

DE ENGENHARIA CIVIL DA ESCOLA POLITÉCNICA DA UNIVERSIDADE

FEDERAL DO RIO DE JANEIRO COMO PARTE DOS REQUISITOS

NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE ENGENHEIRO CIVIL.

Examinado por:

________________________________________________ Prof. Matheus Henrique de Sousa Oliveira, D.Sc.

________________________________________________ Prof. Glaydston Mattos Ribeiro, D.Sc.

________________________________________________ Prof. Ricardo de Souza Alencar, M.Sc.

RIO DE JANEIRO, RJ - BRASIL MARÇO de 2020

Page 4: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

Rodrigues, Eduardo Raid Uso de Big Data na promoção da mobilidade sustentável:

Aplicação da análise de componentes principais para

estimação de padrões de comportamento de usuários do

aplicativo BIKLIO / Eduardo Raid Rodrigues – Rio de Janeiro:

UFRJ/Escola Politécnica, 2020.

XII, 79 p.: il.; 29,7 cm. Orientador: Matheus Henrique de Sousa Oliveira

Projeto de Graduação – UFRJ/ Escola Politécnica/ Curso de Engenharia Civil, 2019.

Referências Bibliográficas: p. 74-79 1. Introdução 2. Mobilidade e Desenvolvimento Sustentável 3. Transformando Dados em Informação 4. Análise Multivariada 5. Método e Aplicação 6. Considerações Finais I. Oliveira, Matheus Henrique de Sousa II. Universidade Federal do Rio de Janeiro, Escola Politécnica, Curso de Engenharia Civil. III. Título

Page 5: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

AGRADECIMENTOS

Agradeço aos meus pais, por tudo. Ao meu irmão, que sempre foi referência. E às

minhas avós, pelo amor e carinho.

Agradeço aos meus grandes amigos da vida, que sempre me apoiaram, e às

amizades que construí dentro da faculdade.

Agradeço a UFRJ pelo ensino de ponta, pela ampliação da minha visão de mundo

e pelas oportunidades que me proporcionou.

Por fim, agradeço a todos os meus professores e mestres, em especial ao Matheus,

meu orientador, que comprou essa briga comigo.

Page 6: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

Resumo do Projeto de Graduação apresentado à Escola Politécnica/ UFRJ como parte

dos requisitos necessários para a obtenção do grau de Engenheiro Civil.

USO DE BIG DATA NA PROMOÇÃO DA MOBILIDADE SUSTENTÁVEL:

APLICAÇÃO DA ANÁLISE DE COMPONENTES PRINCIPAIS PARA

ESTIMAÇÃO DE PADRÕES DE COMPORTAMENTO DE USUÁRIOS DO

APLICATIVO BIKLIO

Eduardo Raid Rodrigues

Março de 2020

Orientador: Matheus Henrique de Sousa Oliveira

Curso: Engenharia Civil

A preocupação mundial com a sustentabilidade reflete a necessidade de se pensar em

políticas e soluções de transporte de forma articulada com o uso do solo e que levem em

conta aspectos sociais, ambientais e econômicos. Principalmente em países em

desenvolvimento como o Brasil, busca-se caminhos para reduzir as externalidades

negativas associadas ao acelerado processo de urbanização das cidades e do crescimento

excessivo da frota de veículos individuais motorizados. A transformação dessa realidade

ocorre a medida em que a mobilidade urbana é orientada ao uso de modos menos

agressivos ambientalmente e que melhor aproveitam os recursos e a infraestrutura urbana

existente, além de estar alinhada aos princípios de integração e equidade. Atualmente, o

uso da tecnologia da informação e comunicação permite que muitos dos dados gerados

pelas cidades sejam transformados em informação útil, tanto para agentes públicos como

para serviços privados. Diante desse contexto, este trabalho buscou aplicar a técnica da

Análise de Componentes Principais a uma base de dados de um aplicativo que incentiva

a mobilidade por bicicleta, o BIKLIO. A partir dos resultados, constatou-se que, com

poucos componentes principais, era possível explicar grande parte da rotina diária de

deslocamento dos usuários do aplicativo.

Palavras-chave: Análise de Componentes Principais; mobilidade sustentável;

cidades inteligentes; bicicleta

Page 7: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

Abstract of Undergraduate Project presented to POLI/UFRJ as a partial fulfillment of the

requirements for the degree of Civil Engineer.

USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF

PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE

OF BIKLIO USERS.

Eduardo Raid Rodrigues

March 2020

Adviser: Matheus Henrique de Sousa Oliveira

Course: Civil Engineering

The global concern about sustainability highlights the necessity of regarding the

integrated approach of transport solutions and public policies and the use of land, also

considering social, environmental and economic issues. Particularly in developing

countries like Brazil, there is an effort in finding ways to reduce the negatives externalities

associated to the accelerated urbanization process and the ingress of the individual car

fleet. This transition occurs when urban mobility is oriented to transportation modes that

are environmentally friendly and use available resources and existing infrastructure in a

more efficient way, also regarding social equality and integration principles. Nowadays,

the information and communication technology plays an important role in transforming

data generated by the cities in useful information for public and private agents. In this

scenario, it is applied the Principle Component Analysis on the data base of an application

that rewards bike commuting, BIKLIO. Out of the values found, it was verified that a few

principle components accounted to a high percentage of the total variance of the data and,

thus, a structure in the user’s routine could be identified.

Keywords: Principle Component Analysis; sustainable mobility; intelligent cities; bike

transit

Page 8: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

SUMÁRIO

1 INTRODUÇÃO .................................................................................................. 1

APRESENTAÇÃO DO TEMA E JUSTIFICATIVA ..................................... 1

OBJETIVO ................................................................................................... 2

METODOLOGIA ......................................................................................... 3

ESTRUTURA DO TRABALHO ................................................................... 3

2 MOBILIDADE E DESENVOLVIMENTO SUSTENTÁVEL .......................... 5

MOBILIDADE URBANA SUSTENTÁVEL ................................................ 6

2.1.1 Sustentabilidade ambiental ......................................................................... 7

2.1.2 Sustentabilidade econômica ........................................................................ 8

2.1.3 Justiça Social.............................................................................................. 9

ATRIBUTOS DA MOBILIDADE SUSTENTÁVEL....................................10

BICICLETA E ACESSIBILIDADE .............................................................12

2.3.1 Benefícios da bicicleta .............................................................................. 14

2.3.2 Componentes de integração do modo cicloviário ...................................... 16

2.3.2.1 Infraestrutura urbana e fatores culturais ............................................16

2.3.2.2 Sistema de compartilhamento de bicicletas .......................................17

2.3.2.3 Estacionamento de bicicletas nos terminais de transporte ..................17

2.3.2.4 Integração do planejamento e operação .............................................17

2.3.2.5 Integração de informações ................................................................18

2.3.2.6 Regulamentação e uso de bicicletas a bordo ......................................18

2.3.3 Impacto da integração da bicicleta com transportes de massa.................... 18

3 TRANSFORMADO DADOS EM INFORMAÇÃO .........................................21

CIDADES INTELIGENTES ........................................................................22

3.1.1 Digitalização e Cidades inteligentes ......................................................... 24

SISTEMAS INELIGENTES DE SERVIÇOS ...............................................26

ANÁLISE DE BIG DATA E A AMOBILIDADE URBANA ........................28

3.3.1 O Aplicativo BIKLIO ............................................................................... 30

4 ANÁLISE MULTIVARIADA ...........................................................................33

CONCEITO DA ÁLGEBRA MATRICIAL ..................................................33

4.1.1 Autovalores .............................................................................................. 33

Page 9: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

4.1.2 Autovetores .............................................................................................. 34

4.1.3 Matrizes de covariância e correlação ........................................................ 35

4.1.3.1 Matriz de Covariância.......................................................................35

4.1.3.2 Matriz de Correlação ........................................................................36

TÉCNICAS MULTIVARIADAS .................................................................37

ANÁLISE DE COMPONENTES PRINCIPAIS ...........................................40

4.3.1 Definição ................................................................................................. 40

4.3.2 Interpretação algébrica ............................................................................. 41

4.3.3 Interpretação geométrica ......................................................................... 43

4.3.4 Matriz de covariância e matriz de correlação ............................................ 44

4.3.5 Quantos componentes principais escolher? ............................................... 46

4.3.5.1 Porcentagem acumulada do total de variância ...................................46

4.3.5.2 Valor da variância dos componentes principais .................................47

ANÁLISE FATORIAL ................................................................................47

COMPARAÇÃO ENTRE MÉTODOS .........................................................49

5 MÉTODO E APLICAÇÃO ...............................................................................51

BANCO DE DADOS ...................................................................................51

5.1.1 Tratamento dos dados ............................................................................... 52

MODELO PROPOSTO ................................................................................55

5.2.1 Análise de componentes principais no modelo proposto ........................... 55

RESULTADOS OBTIDOS NA MODELAGEM E ANÁLISES ...................56

5.3.1 Indivíduo .................................................................................................. 56

5.3.1.1 Componentes principais ....................................................................57

5.3.1.2 Variância ..........................................................................................59

5.3.2 Cidade de Lisboa ...................................................................................... 60

5.3.2.1 Componentes principais ....................................................................60

5.3.2.2 Variância ..........................................................................................63

5.3.3 Comparação de resultados ........................................................................ 64

6 CONSIDERAÇÕES FINAIS .............................................................................66

CONCLUSÃO .............................................................................................66

PESQUISAS FUTURAS ..............................................................................67

Page 10: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

1 1 INTRODUÇÃO

APRESENTAÇÃO DO TEMA E JUSTIFICATIVA

Desde meados do século passado, muitas cidades brasileiras passaram a apresentar

sistemas de mobilidade de baixa qualidade e de alto custo, com impactos negativos na

vida das pessoas e nos custos econômicos e ambientais para a sociedade

(VASCONCELLOS, 2011).

Esse processo de degradação da mobilidade urbana foi causado, principalmente,

por causa do aumento do transporte individual motorizado, pelo acelerado processo de

urbanização e pela falta de planejamento público. Como consequência, houve forte

crescimento dos índices de acidentes de trânsito e congestionamentos, além do aumento

da quantidade de emissão de gases poluentes no ambiente. E não há evidências de que

este quadro se altere no futuro próximo, já que os incentivos à produção, venda e

utilização de veículos privados prevalecem sobre medidas de estímulo ao uso do

transporte público e do transporte não motorizado (CARVALHO, 2016).

Diante desse contexto, o debate sobre os principais atributos que caracterizariam

um modelo de mobilidade urbana sustentável e os caminhos e os princípios a se seguirem

para viabilizá-lo se tornou cada vez mais forte e relevante para o desenvolvimento das

cidades. Segundo Mello (2015), pensar na mobilidade sustentável requer a consideração

de três dimensões: social, ambiental e econômica.

Nesse cenário, as políticas de incentivo ao uso da bicicleta, seja para viagens de

curta e média distância ou para integração com meios coletivos de transporte, são

importantes para a transição do comportamento dos indivíduos no caminho de reduzir as

externalidades negativas associadas ao uso excessivo de automóveis nas cidades

(MELLO, 2015).

Discutir as cidades, então, torna-se um tema crítico e de grande importância,

particularmente com vistas ao cenário futuro de crescimento populacional nos centros

urbanos (BERNARDES et al., 2017). A busca por soluções inteligentes para o

enfrentamento dos desafios relacionados forte urbanização e seus impactos traz o

conceito de Cidades Inteligentes (Smart City) (ANDRADE et al., 2016), que está

diretamente relacionado à aplicação da tecnologia da informação e comunicação na

solução de problemas, melhora de serviços, otimização de recursos e adaptação da

infraestrutura existente nas cidades.

Page 11: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

2 Com as cidades ao redor do mundo coletando constantemente dados da vida

urbana, o grande desafio, atualmente, é saber como processar e analisá-los de forma que

seja possível, a partir deles, produzir conhecimento e informação útil. No âmbito das

análises de Big Data, avanços tecnológicos ligados ao desenvolvimento de hardwares e

softwares vêm nos ajudando a aplicar técnicas de análise complexas, especialmente

quando envolvem problemas de múltiplas variáveis.

Para o desenvolvimento desse trabalho, foi adotada a premissa de que apesar de

observações discretas do comportamento de um indivíduo parecerem aleatórias,

tipicamente elas se repetem de forma que podem ser identificadas rotinas na vida de

qualquer pessoa. Para muitos, os dias de semana são aqueles em que se deve acordar cedo

para o trabalho, realizar uma pausa para o almoço e voltar no final do dia para casa. As

rotinas de finais de semanas são caracterizadas, muitas vezes, por passeio de lazer durante

o dia, saída com amigos em um sábado a noite ou um almoço de domingo em família

(EAGLE e PENTLAND, 2009).

O cerne da pesquisa está, portanto, na exploração e investigação da base de dados

de um aplicativo de mobilidade sustentável, o BIKLIO. Este aplicativo tem como

principal objetivo criar uma rede de conexões entre ciclistas de uma cidade e

estabelecimentos comerciais parceiros, que oferecem, pela plataforma, benefícios aos

usuários que optam por se deslocar de bicicleta. A base usada contém registros de

utilização do aplicativo de todos os usuários da cidade de Lisboa desde o lançamento do

aplicativo, em setembro de 2017.

A análise dos dados foi feita através da utilização de uma técnica de análise

multivariada conhecida por Análise de Componentes Principais, cujo princípio está na

redução dimensional de uma base complexa por meio da definição de novas variáveis

que, em menor número, explicam boa parte da variância original dos dados.

OBJETIVO

O objetivo primário do trabalho é conduzir um exemplo de aplicação de uma

técnica de análise multivariada (a Análise de Componentes Principais) a partir da

modelagem de dados de um aplicativo de mobilidade para observar a existência de

padrões de comportamento entre usuários.

Page 12: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

3 Além disso, o presente trabalho visa aprimorar a bibliografia existente, sobretudo

nas pesquisas brasileiras, sobre o tema da mobilidade urbana, explorando a importância

da mobilidade ativa como via para o desenvolvimento sustentável.

Também faz parte do escopo do objetivo do trabalho expor a importância da

tecnologia da informação na geração de conhecimento e consolidação de cidades

inteligentes.

METODOLOGIA

Inicialmente, fez-se uma revisão bibliográfica a respeito dos conceitos da

mobilidade urbana sustentável, das atribuições da mobilidade por bicicleta e da aplicação

da análise de dados em diversos sistemas.

Em seguida, consultou-se a literatura disponível acerca da técnica de análise

multivariada base para a modelagem pretendida: Análise de Componentes Principais

(ACP).

Procedeu-se à modelagem em si, adotando como ponto de partida o tratamento e

estruturação dos dados provenientes de uma base de registros de viagens de um aplicativo

de mobilidade, o BIKLIO. Com o modelo pronto, foi aplicada a técnica multivariada e

extraídos os resultados em dois diferentes cenários: (i) utilizando-se os registros de

viagens de um único indivíduo e (ii) fazendo a análise dos registros de todos os usuários

do aplicativo na cidade de Lisboa. Os resultados foram interpretados individualmente e,

também, de forma comparativa.

ESTRUTURA DO TRABALHO

Neste trabalho, o primeiro capítulo limitou-se a introduzir e inteirar o leitor a

respeito do tema a ser desenvolvido, expondo a justificativa, objetivo, metodologia, e

como o trabalho foi estruturado.

A partir do segundo capítulo, procedeu-se com o desenvolvimento do tema a partir

da literatura existente. Foram apresentados conceitos que englobam a mobilidade

sustentável e os fatores que justificam a inserção e a importância do uso das bicicletas em

políticas públicas.

O terceiro capítulo trata da análise de Big Data como um dos pilares para o

surgimento de cidades inteligentes. Neste capítulo, também são conceituados os sistemas

Page 13: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

4 inteligentes de serviços e elencados suas possíveis categorizações, além de tratar da

análise de Big Data em serviços de mobilidade.

O quarto capítulo aborda alguns conceitos da álgebra matricial importantes para o

entendimento da ferramenta utilizada na análise do modelo proposto. Em seguida, é

apresentada a técnica da Análise de Componentes Principais como ferramenta para achar

padrões em modelos com múltiplas variáveis correlacionadas.

No quinto capítulo, os resultados obtidos com as modelagens foram apresentados,

tanto para a aplicação em uma base de um único usuário quanto para a base de registros

da cidade de Lisboa. Eles foram investigados individualmente e comparados entre si

posteriormente.

No sexto e último capítulo, foram discutidas as conclusões obtidas, além de

sugestões para futuros desenvolvimentos do tema.

Por fim, são apresentadas as referências bibliográficas, ordenadas

alfabeticamente.

Page 14: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

5 2 MOBILIDADE E DESENVOLVIMENTO SUSTENTÁVEL

Tornar as cidades mais inclusivas e sustentáveis até 2030 é um dos desafios do

Brasil e de outros 192 países que se comprometeram, em 2015, com os Objetivos de

Desenvolvimento Sustentável da ONU (ONU, 2019). Segundo Mello (2015), o termo

sustentabilidade tornou-se palavra chave nas últimas décadas, o que reflete a preocupação

mundial a respeito do tema.

O conceito mais amplamente aceito para a sustentabilidade é o de um padrão de

desenvolvimento que atenda às necessidades do presente sem comprometer o

atendimento das gerações futuras (WCED, 1987). Nesse âmbito, é reconhecida a

existência de três dimensões principais: econômica, social e ambiental (MELLO, 2015).

Esta tridimensionalidade faz parte de um processo evolutivo, com ênfase inicial

puramente econômica, seguida da inclusão de aspectos sociais, até a abordagem de

aspectos ambientais mais recentemente (LEMOS, 2011).

Na engenharia de transportes, o desafio para promover a sustentabilidade está

inteiramente relacionado ao desenvolvimento e promoção da mobilidade sustentável

(MELLO, 2015).

A mobilidade é parte vital do desenvolvimento das cidades e, portanto, as soluções

de planejamento da mobilidade urbana devem levar em consideração a relevância das três

dimensões, caso contrário pode haver prejuízo a qualidade de vida da população. Fato é

que, ao longo dos últimos anos, aumentou-se o reconhecimento dos impactos causados

pelo uso excessivo dos automóveis nas cidades, principalmente em termos de poluição

sonora, congestionamentos, segurança no trânsito, mudanças climáticas e sedentarismo

(FISHMAN, 2016).

Nesse contexto, Curtis (2008) aborda a questão da sustentabilidade e dos sistemas

de transporte e pontua a necessidade de haver um equilíbrio entre as externalidades

negativas (uso de energia, poluição e emissão de gases) e as positivas (alto nível de

acessibilidade). Segundo Mello (2015), para entender melhor a articulação entre esses

dois campos, é preciso conhecer mais sobre a relação entre transporte e uso do solo, que

é uma preocupação inerente ao conceito de acessibilidade.

Holden et. Al (2013) relata, portanto, o surgimento de um novo conceito de

transporte de passageiros, em que se considera não só os impactos ambientais e

econômicos, como a equidade social, saúde, segurança e qualidade de vida dos usuários.

Page 15: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

6 A garantia de acessibilidade, nesse contexto, pode ser vista como elemento capaz de gerar

inclusão social, seja por meio do planejamento da ocupação e uso do solo, seja por meio

de medidas relativas ao sistema de transportes (LUZ, 2018).

A Figura 1 mostra como acontece a articulação entre acessibilidade e a mobilidade

sustentável.

Figura 1 - Articulação da acessibilidade com a mobilidade sustentável (LUZ, 2018)

Assim, tratar o binômio transportes e sustentabilidade requer que sejam

considerados os objetivos de desenvolvimento, o perfil de mobilidade almejado e, por

conseguinte, o padrão de acessibilidade necessário para alicerçar o alcance da

sustentabilidade (MELLO, 2015).

MOBILIDADE URBANA SUSTENTÁVEL

A mobilidade sustentável pode ser entendida como a promoção do equilíbrio entre

a satisfação das necessidades humanas de deslocamento com a proteção do ambiente

natural. Isto implica que a oferta de bens e serviços deve estar disponível e compatível

com as demandas da população, além de apresentar estabilidade e regularidade ao longo

do tempo. Tudo isso de forma que o impacto ambiental não comprometa a capacidade

futura de satisfação das demandas das próximas gerações (CARVALHO, 2016).

Assim, da mesma forma que se trabalha o desenvolvimento sustentável nas três

dimensões principais – econômica, social e ambiental –, o mesmo pode ser feito em

relação aos sistemas de mobilidade. Trazendo essas dimensões para o campo da

mobilidade urbana, podem-se traçar os pressupostos básicos de uma mobilidade urbana

sustentável, nos quais a proteção ambiental, a sustentabilidade econômica e a justiça

social se tornam condicionantes importantes no processo de planejamento (Figura 2)

(CARVALHO, 2016).

Page 16: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

7

Figura 2 - Dimensões da mobilidade urbana sustentável (CARVALHO, 2016)

2.1.1 Sustentabilidade ambiental

Sob a ótica da sustentabilidade ambiental, as cidades devem ter permanente

preocupação em aumentar a participação do transporte público coletivo e do transporte

não motorizado em sua matriz de modos de deslocamentos. Como mostra a Figura 3, os

gastos de energia e, consequentemente, emissões de poluentes per capita são muito

menores entre os modos coletivos de transporte. Assim, cidades orientadas à mobilidade

ativa e ao transporte público apresentam menores níveis de poluição atmosférica e sonora,

além de serem mais funcionais do que as cidades com alto grau de uso de veículos

motorizados privados (CARVALHO, 2016).

Figura 3 - Emissões de CO2 as modalidades de transporte urbano por passageiro e

quilômetro (IPEA, 2011)

Vale ressaltar, ainda, que as questões ligadas à organização, à forma e ao

desenvolvimento das cidades também são importantes para a sustentabilidade ambiental.

Pesquisas da UN Habitat (2013) apontam que cidades com formas urbanas mais densas

são orientadas ao transporte público e ao uso misto do solo. Essas características criam

Page 17: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

8 condições favoráveis tanto para o uso de transportes compartilhados quanto para opções

de mobilidade ativa (ex: a pé, bicicleta). Por outro lado, cidades menos densas, com áreas

mais espraiadas e grandes vazios urbanos são altamente dependentes de transporte

motorizado individual. Isso ocorre porque as viagens são mais extensas e não há escala

adequada para viabilizar sistemas de transporte de massa.

Ainda, segundo Carvalho (2016), a tecnologia à combustão atual está chegando

no seu limite de eficiência e, portanto, ganhos maiores no futuro demandarão grandes

alterações tecnológicas, como os veículos híbridos, por exemplo, ou alteração completa

da matriz energética, com a utilização de combustíveis mais limpos (hidrogênio,

biocombustíveis etc.).

Dessa forma, as políticas públicas que busquem maior sustentabilidade ambiental

para os sistemas de mobilidade urbana devem seguir dois caminhos: i) aumento da

eficiência da rede, com a maior participação dos modos de transporte coletivo e dos não

motorizados na matriz de modos de deslocamentos; e ii) aumento da eficiência dos

veículos automotores, com a utilização de combustíveis mais limpos e a busca de maior

eficiência das tecnologias à combustão tradicionais (CARVALHO, 2016).

2.1.2 Sustentabilidade econômica

Os sistemas de mobilidade, com destaque para o transporte público, devem

apresentar equilíbrio econômico-financeiro. Para tanto, os custos dos serviços têm de ser

definidos corretamente pelo poder público, com políticas claras e transparentes de

financiamento e custeio (CARVALHO, 2016).

No Brasil, como o financiamento da operação é realizado quase que

exclusivamente pela arrecadação tarifárias, as classes mais altas contribuem muito pouco

com o custeio do transporte público, mesmo que sejam beneficiárias indiretas dos

serviços prestados. Por outro lado, os mais pobres e, consequentemente, mais

dependentes dos serviços de transporte público, comprometem boa parte de suas rendas

para este fim (CARVALHO, 2016).

Segundo Carvalho (2016), para tornar o financiamento do transporte público mais

equitativo, torna-se necessária a discussão sobre fontes alternativas de financiamento aos

sistemas de mobilidade. De forma geral, o financiamento deve contemplar maiores

dispêndios por parte dos mais ricos e ser oriundo, principalmente, das compensações das

Page 18: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

9 modalidades que provocam maiores externalidades, como o transporte individual, por

exemplo.

Além disso, os sistemas de planejamento de transporte têm de dispor de recursos

externos ao setor para que haja condições de ampliação e qualificação constantes dos

serviços de mobilidade. Nesse sentido, novas fontes de financiamento tornam-se

fundamentais, não só para redução dos preços cobrados, mas, também, para atender aos

anseios da sociedade quanto à melhoria do sistema de transporte (CARVALHO, 2016).

2.1.3 Justiça Social

A dimensão da justiça social na mobilidade sustentável se refere, basicamente, aos

princípios de acessibilidade universal. Garantir acessibilidade universal implica que os

serviços de transporte tenham de atender a todos os cidadãos ou seja, toda a população

tem o direito de usufruir das oportunidades e dos equipamentos das cidades

(CARVALHO, 2016).

Para que isso ocorra, o sistema de transporte tem de ser dimensionado e planejado

de forma abrangente, focando, inclusive, nos grupos minoritários que apresentam

dificuldades de mobilidade, como pessoas com deficiência e os mais pobres

(CARVALHO, 2016)

Neste contexto, pode-se estabelecer uma distinção clara entre crescimento

(aspectos quantitativos) e desenvolvimento (aspectos qualitativos). Litman (2008)

argumenta que, na atualidade, uma ênfase maior nos aspectos qualitativos faz parte de um

processo de mudança de paradigma. Em outras palavras, o crescimento econômico é

condição importante, mas não suficiente para o desenvolvimento, já que este pressupõe

que haja um processo de inclusão social (HADDAD, 2001), com distribuição das

oportunidades de forma igualitárias entre às pessoas (MACHADO, 2010). Kusakabe

(2013) destaca, ainda, que não é possível haver desenvolvimento sustentável enquanto a

pobreza e as injustiças sociais forem presentes.

Para Carvalho (2016), as condições de mobilidade da população são bastante

críticas sob a ótica da equidade social. As classes mais altas contam com um maior índice

de mobilidade (viagens por habitantes) em função da sua maior renda. Já os mais pobres,

têm sua mobilidade bastante impactada, tanto pelas privações nos deslocamentos em

função da renda como pelas piores condições de transporte às quais são submetidos.

Page 19: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

10 Assim, a deterioração do transporte público e o seu encarecimento prejudicam, sobretudo,

as classes mais baixas, provocando aumento das desigualdades existentes nas condições

de mobilidade da população.

As políticas para minimizar essas iniquidades estão relacionadas à priorização e

ao barateamento do transporte público em relação ao transporte individual e, também, a

melhor distribuição de empregos e oportunidades no território (CARVALHO, 2016).

Nesse sentido, um princípio importante na dimensão social é a da modicidade

tarifária. Isso significa que as tarifas dos transportes públicos devem ser acessíveis a todos

os segmentos da população e as políticas sociais de concessão de benefícios devem focar

nas classes menos favorecidas (CARVALHO, 2016).

Outro princípio importante é a equidade nas condições de mobilidade das pessoas

e, também, no uso do espaço urbano. Historicamente, os mais pobres moram nas

periferias, distante das áreas mais dinâmicas economicamente e que concentram a maior

parte dos empregos, oportunidades e serviços urbanos. Somado a isso, os investimentos

em mobilidade costumam ser destinados às áreas mais ricas e aos sistemas de transporte

privado, corroborando para precarização da condição de vida de uma grande parcela da

população (CARVALHO, 2016).

Traçando um paralelo entre o uso e ocupação do solo e o desenvolvimento

sustentável, Mello (2015) aponta que à medida que as áreas urbanas se tornam menos

espraiadas, a qualidade de vida das pessoas, principalmente aquelas que vivem nos

subúrbios, tende a aumentar. Isto se justifica porque, nesses casos, as áreas residenciais

passam a acessar com maior facilidade os serviços, o emprego e a renda, ao mesmo tempo

que os centros tradicionais e consolidados se tornam menos congestionados.

ATRIBUTOS DA MOBILIDADE SUSTENTÁVEL

Somado aos esforços no sentido de alcançar um conceito mais preciso e completo

de mobilidade sustentável, é necessário entender as ações mais adequadas para serem

tomadas com relação a mobilidade existente. Para tanto, é importante compreender os

atributos que estão envolvidos nesse contexto. Mello (2015), então, destaca cinco

atributos (Figura 3) capazes de expressar a sustentabilidade na mobilidade.

Page 20: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

11

Figura 4 - Atributos da mobilidade sustentável (LUZ, 2018)

Segundo Mello (2015), para a mobilidade ser sustentável, ela deve ser:

• Produtiva: Atributo da dimensão econômica (LITMAN, 2015), refletindo uma

mobilidade que favorece o uso de meios de transportes mais eficientes em termos

de recursos energéticos (EPA, 2012; WAPC, 2012) e que utilizam a

infraestrutura existente de forma mais racional (MELLO, 2015). Isto é,

direcionada às modalidades de maior capacidade e mais efetivas em atender a

demandas de viagens, sempre de forma integrada aos demais modos de menor

capacidade (LUZ, 2018). O mesmo se aplica a utilização do espaço viário, que

deve priorizar os modos coletivos de transporte, e a proteção das modalidades

mais vulneráveis, como as não motorizadas (UITP, 2003);

• Inclusiva: A inacessibilidade ou isolamento geralmente não é considerada no

planejamento de transporte (LITMAN, 2015). Apesar desta não ser uma

realidade dos setores da sociedade com maior poder aquisitivo, que dispõem de

alternativas para se deslocar, ela existe entre as camadas mais pobres, violando

o direito de cidadania (MELLO, 2015). A imobilidade, expressa pelo número

significativo de pessoas que não se deslocam e, por isso, não desfrutam do

território e de seus direitos, é uma questão séria. Isto porque a mobilidade deve

representar condições que permitam o atendimento universal das necessidades

de viagens, em especial daqueles com restrições físicas e de renda (ABLEY e

HALDEN, 2013);

• Segura: A mobilidade deve garantir o compromisso com a saúde, a integridade

e o direito à vida, e ocorrer em condições seguras, com menos riscos, conflitos,

Page 21: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

12 acidentes e mortes nas viagens, particularmente no trânsito (FERSI/ ECTRI,

2009; LITMAN e FITZROY, 2014);

• Justa Socialmente: A mobilidade com qualidade de serviço para todos e que

possa ser realizada em tempos acessíveis. Estas condições são importantes para

que todos desfrutem de atividades e oportunidades fundamentais para se

melhorar a qualidade de vida e o bem-estar social (WELCH, 2013; WELCH e

MISHRA, 2013); e

• Verde: A mobilidade verde é compromissada com modos de transporte que

utilizam energia limpa e em condições focadas na redução da poluição

atmosférica, sonora e emissões de gases do efeito estufa (PORTER et al., 2013).

A consideração dos atributos acima mencionados significa, na prática, que há um

processo evolutivo em andamento, através do qual as dimensões social e ambiental

passam a ser incorporadas na agenda, junto com a dimensão econômica. E as três são

válidas em qualquer escala territorial, alterando-se apenas a maneira de como lidar com

os transportes e o uso do solo na contemplação da sustentabilidade (MELLO, 2015).

Através do aproveitamento e combinação de oportunidades como a otimização de

serviços digitais de mobilidade, novos métodos construtivos e de fabricação e novos

modelos de negócios, um novo sistema de mobilidade urbana pode ser traçado para

atender anseios econômicos, sociais e ambientais no desenvolvimento da cidade (ELLEN

MACARTHUR FOUNDATION, 2019).

Além disso, a necessidade de se considerar uma visão sistêmica e sustentável a

respeito da mobilidade urbana garantiu um aumento de visibilidade para o modo

cicloviário. Soluções de mobilidade que incentivam a transição para transportes ativos (a

pé, bicicleta) e veículos leves (carros elétricos, patinetes, micro-ônibus) são

frequentemente viáveis e podem garantir ganhos produtivos, melhora da saúde pública,

redução do consumo de recursos finitos e diminuir emissão de poluentes (ELLEN

MACARTHUR FOUNDATION, 2019).

BICICLETA E ACESSIBILIDADE

O transporte motorizado é visto por Sanz (1996) (apud Machado, 2010) como a

causa principal dos impactos ao meio ambiente urbano, e dentre as alternativas para

minimizar suas consequências ambientais e sociais negativas está a redução da

Page 22: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

13 mobilidade motorizada individual, tanto no que ser refere ao volume quanto à distância

dos deslocamentos.

Em 2018, os veículos circulantes (automóveis, motocicletas, comerciais leves e

caminhões) no Brasil já contabilizavam 44,8 milhões de unidades, com aumento de 1,9%

em relação ao ano anterior. E as projeções para os anos seguintes são de crescimento

ainda mais acentuado, com 2,3% em 2019 e 2,6% em 2020 (SINDIPEÇAS e ABIPEÇAS,

2019).

A Figura 5 mostra essa mudança significativa dos padrões de viagens desde

meados do século XX na cidade do Rio de Janeiro. Com o avanço da indústria

automobilística e os incentivos fiscais do governo para a compra de automóveis,

favoreceu-se o deslocamento motorizado individual (CARVALHO, 2016).

Figura 5 - Distribuição de viagens motorizadas (CARVALHO, 2016)

Outros impactos deste processo são exemplificados pela Figura 6, que apresenta

o desperdício estrutural associado aos sistemas tradicionais de mobilidade. A Ellen

Macarthur Foundation (2015) aponta, por exemplo, que os carros na Europa, que têm em

média 5 assentos, carregam apenas 1,5 pessoas por viagem, gerando espaços ociosos e

contribuindo para o aumento de congestionamentos. Além disso, 86% da energia

potencial do tanque de combustível não contribui para o deslocamento do veículo,

transformando-se em perda. A pesquisa revela, ainda, que até 50% das terras nos centros

urbanos são ocupadas por estradas, ruas, estacionamentos e postos de serviços, contudo

apenas 10% das vias são efetivamente utilizadas nos horários de pico de deslocamento.

Dessa forma, de acordo com Costa et al. (2004), torna-se fundamental promover

o equilíbrio entre os diferentes modos de transporte e incentivar os modos não

motorizados.

Page 23: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

14 É importante enfatizar que ao tornar o uso do automóvel menos atrativo, os meios

de transporte devem ser melhorados (transporte público, infraestrutura para o ciclista,

infraestrutura para caminhadas, etc.) (GÄRLING et al., 2003). De forma mais abrangente,

a Gestão da Mobilidade pode ser descrita como uma estratégia que ajuda na redução do

volume total de tráfego através do encorajamento nas mudanças no comportamento de

indivíduos e de organizações, como o uso da bicicleta.

Figura 6 - Desperdício estrutural no sistema de mobilidade tradicional (ELLEN

MACARTHUR FOUNDATION, 2015)

2.3.1 Benefícios da bicicleta

A bicicleta integra o conjunto conhecido como meios de transporte não-

motorizados, definidos como aqueles em que as viagens são livres de consumo de

combustíveis fósseis. Ela é o meio de transporte que apresenta o menor consumo de

energia primária em MJ (Mega Joule) por passageiro-km, enquanto que o automóvel é o

líder de consumo (ver Figura 7) (SILVEIRA, 2010).

Dessa forma, políticas de incentivo ao uso da bicicleta, seja para viagens de curta

e média distância ou para integração com meios coletivos de transporte, são importantes

para a transição do comportamento dos indivíduos no caminho de reduzir impactos

ambientais na mobilidade.

Page 24: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

15

Figura 7 - Comparação dos diversos meios de transporte do ponto de vista ecológico em relação ao automóvel para um deslocamento equivalente em pessoas/quilômetro. Base –

100 (automóvel sem catalisador) (COMISSÃO EUROPEIA, 2000).

Além de ser rápida e eficiente em trajetos urbanos curtos, a bicicleta garante uma

melhor acessibilidade à população, sendo seus benefícios de diversas naturezas:

• Econômica: diminuição da parte do orçamento familiar destinada ao automóvel,

redução das horas de trabalho perdidas no congestionamento e redução das

despesas médicas devido aos exercícios regulares;

• Política: redução da dependência energética e econômica de recursos não

renováveis;

• Social: democratização da mobilidade e melhor autonomia e acessibilidade;

• Ecológica: não utiliza combustíveis fósseis e não gera gases de efeito estufa

Todavia, esses benefícios não se limitam ao campo do indivíduo, atingindo,

também, a coletividade urbana. Dentre eles pode-se destacar (COMISSÃO EUROPÉIA,

2000):

• Ausência total de impacto sobre a qualidade de vida na cidade (nem ruído, nem

poluição);

• Preservação dos monumentos e das plantações;

• Uso mais racional e eficiente do solo, tanto para se deslocar quanto para

estacionar.

Page 25: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

16 • Menor degradação da rede viária e redução de programas de novas

infraestruturas viárias;

• Diminuição dos congestionamentos e das perdas econômicos a eles atrelados;

• Maior fluidez da circulação de veículos;

• Maior poder de atração dos transportes públicos;

• Melhor acessibilidade aos serviços tipicamente urbanos;

2.3.2 Componentes de integração do modo cicloviário

Para a Comissão das Comunidades Europeias (apud Costa, 2008), repensar a

mobilidade urbana passa por otimizar a utilização de todos os meios de transporte, mas

também pela integração entre diferentes modos coletivos e individuais.

Transportes de massa, como metro, trens e BRT têm o diferencial de possuírem

grande capacidade e boa eficiência na relação de custo e uso do solo. Contudo, esses

modos de transporte nem sempre atendem à todas as necessidades dos usuários, que

buscam maior conveniência e integração com o restante do sistema (ELLEN

MACARTHUR FOUNDATION, 2019).

Kager e Harms (2017) destacam em seus estudos seis componentes que

determinam o grau de integração do modo cicloviário com outros mecanismos de

mobilidade, especialmente os transportes de massa.

2.3.2.1 Infraestrutura urbana e fatores culturais

A integração do modo cicloviário com transportes de massa, e os consequentes

resultados dessa sinergia, depende fundamentalmente da provisão de uma infraestrutura

urbana adequada e do fortalecimento cultural nesse sentido, para que ambos subsistemas

sejam efetivamente utilizados (CERVERO et al, 2012). Todavia, mudar uma cultura de

transporte existente ou prover a infraestrutura necessária em um contexto com demanda

limitada é um desafio para as políticas públicas. A complexidade do problema está na

interligação entre o investimento e o aumento do uso desses sistemas, já que pesquisas

revelam que não há uma solução única que garanta esta efetiva mudança de

comportamento dos usuários (PUCHER et al, 2010).

Page 26: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

17 A infraestrutura e a cultura são fundamentais para que se obtenha os benefícios

dessa integração entre modo cicloviário e modos de transporte de massa. Por outro lado,

Brons et al (2019) defende que, até certo ponto, a ausência da infraestrutura de um

subsistema pode ser compensada pelo investimento nos outros subsistemas, se

circunstâncias locais e as oportunidades fizerem destas boas escolhas.

2.3.2.2 Sistema de compartilhamento de bicicletas

Os sistemas de compartilhamento de bicicletas são peças fundamentais na

integração da malha cicloviária com os demais modos de transporte urbano. Eles têm o

diferencial de garantir a disponibilidade de bicicletas, especialmente em viagens que não

têm a casa como origem. (FISHMAN, 2016).

O princípio do sistema de compartilhamento de bicicleta é simples: os indivíduos

usam as bicicletas de acordo com suas necessidades sem se preocupar com as

responsabilidades e os custos de aquisição, garantindo aos usuários uma forma

ecologicamente correta de transporte público. Em termos de mobilidade, esse sistema

também se apresenta como uma boa solução às viagens de curtas e médias distâncias que

são consideradas longas para serem realizadas a pé, como o caminho de uma residência

até um transporte público de massa ou de um terminal até o ambiente de trabalho

(SHAHEEN, GUZMAN E ZHANG, 2010).

2.3.2.3 Estacionamento de bicicletas nos terminais de transporte

Segundo Kager e Harms (2017), a infraestrutura para estacionar bicicletas

particulares deve ser direcionada ao serviço de curta duração (até 24 ou 48 horas),

próximo ao local de residência dos usuários. Já a infraestrutura de estacionamento para

períodos mais longos pode ser trabalhada em áreas comerciais, onde o compartilhamento

não seja viável. De fato, em centros urbanos, os sistemas de compartilhamento de

bicicletas oferecem uma solução mais eficiente, flexível e viável economicamente, por

isso devem ser considerados como primeira opção nesses casos.

2.3.2.4 Integração do planejamento e operação

Apenas com planejamento e gerenciamento integrados é possível desenvolver

ações eficazes e eficientes frente às ameaças e oportunidades do sistema, além de

comparar os benefícios atrelados aos investimentos, aos custos de operação e às políticas

Page 27: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

18 públicas adotadas. Idealmente, a integração entre os modos de transporte deve partir de

uma organização comum que planeja e intervém sobre ambos os sistemas. Em outros

cenários, o governo deveria, ao menos, adotar medidas e estratégias para que essa

integração a nível de regulamentação, planejamento e operação seja possível (KAGER E

HARMS, 2017).

2.3.2.5 Integração de informações

O componente de integração de informações representa a ponta final do vínculo

de integração entre o modo cicloviário e os demais modos de transporte. Ele está

relacionado às sinalizações de trânsito, mapas, informações de viagem, formas de

pagamento, marketing ou alugueis. São exemplos práticos dessa integração as

sinalizações em ciclovias e ciclofaixas indicando locais de estacionamento e paradas,

mapas mostrando as principais rotas para bicicletas e cartões de cobrança que integram

sistemas compartilhados de bicicletas com outros modais (KAGER E HARMS, 2017).

2.3.2.6 Regulamentação e uso de bicicletas a bordo

Sob o ponto de visto do usuário do sistema, a possibilidades de levar bicicletas a

bordo de ônibus (em racks) e trens de forma confiável, rápida, barata e confortável seria,

provavelmente, a melhor maneira para promover a integração do modo cicloviário. No

entanto, apenas uma pequena parcela dos indivíduos opta por esta forma de utilização.

Fato é que o uso de bicicletas a bordo é muito restrito em escalas maiores, devido ao

espaço ocupado por elas nos vagões, elevadores, escadas e plataformas e ao aumento do

tempo de embarque e desembarque. Salvo em casos bem específicos, como a

regulamentação em horários de baixa demanda, este componente não é recomendado

(KAGER E HARMS, 2017).

2.3.3 Impacto da integração da bicicleta com transportes de massa

Essa integração tem dois objetivos diretos: incluir a bicicleta como meio de

transporte habitual nas viagens por motivo de trabalho ou escola nas cidades, e reforçar

modos coletivos como principais meios de transporte para viagens médias e longas das

populações nos médios e grandes aglomerados urbanos (MINISTÉRIO DAS CIDADES,

2007b).

Page 28: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

19 Uma melhor integração do modo cicloviário no sistema de transportes da cidade

impacta diretamente nos padrões de viagens e no modo de uso e ocupação do solo,

garantindo maior acessibilidade à população. Os benefícios e impactos dessa integração

derivam do potencial do modo cicloviário de ser altamente flexível, requerer poucos

recursos de investimento e apresentar alta competitividade em relação a velocidade de

deslocamento nos trajetos urbanos de até 5 km (KAGER E HARMS, 2017).

Dessa forma, aproximar a bicicleta dos terminais e locais de grande demanda de

passageiros é permitir a valorização dos meios coletivos e a ampliação do raio de ação

dos ciclistas nas cidades e nos espaços regionais (MINISTÉRIO DAS CIDADES, 2007b).

Figura 8 - Mecanismo de aumento da área de influência (KAGER E HARMS, 2017).

Para Kager e Harms (2017), um dos mecanismos, através do qual a bicicleta afeta

os padrões de viagem e a ocupação do solo, é a ampliação o raio de influência das estações

de transportes de massa em até 9 vezes comparado com o deslocamento a pé (Figura 8).

Os resultados podem ser percebidos de duas maneiras: mais residências acessam um

número maior de estações, aumentando as opções de viagens para esses indivíduos,

enquanto as estações ficam conectadas a mais residências, aumentando o uso das mesmas,

de suas facilidades e serviços.

Com essa ampliação, as áreas de influência muitas vezes se interceptam. Isto

significa que há, também, um aumento das possibilidades de escolha dos ciclistas, que

podem customizar seus trajetos de acordo com suas preferências, seja aquele com melhor

infraestrutura, com presença de lojas e mercados ou que o destino seja uma estação com

mais facilidades (KAGER E HARMS, 2017).

Page 29: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

20 Vale ressaltar, ainda, que esses fatores aumentam a competitividade do transporte

público frente aos outros meios de transportes, tanto para os ciclistas como para aqueles

que não os acessam de bicicleta. E como se trata de um processo cíclico e retroalimentado,

ele tem efeitos de segunda ordem. Nos locais em que modos de transporte de massa são

mais atraentes, espera-se que as pessoas tenham mais disposição para realizar o

deslocamento até uma estação ou a partir dela (KAGER E HARMS, 2017).

Assim, Kager e Harms (2017) concluem que modos de transporte mais integrados

e acessíveis fortalecem os espaços urbanos, já que ampliam as opções de áreas destinadas

a residências, comércio, lazer, etc, e podem impactar as tomadas de decisão dos cidadãos

a longo prazo a respeito, por exemplo, dos destinos de viagens, da posse de automóveis,

da necessidade de estacionamento e da rotina de atividades. Esses comportamentos foram

estudados por Klinger (2017), que identificou que pessoas recém mudadas para cidades

orientadas ao transporte público e ao ciclismo estavam mais suscetíveis a adotar escolhas

de mobilidade multimodais, mesmo que fossem originalmente de cidades com sistemas

de transportes menos acessíveis.

Por fim, Kager e Harms (2017) pontuam que nos lugares em que a integração entre

o ciclismo e o transporte público está consolidada, há maior ocupação dos espaços

públicos. E quando se tem mais pessoas circulando nas ruas, elas se tornam mais seguras

e atrativas na percepção dos cidadãos, sendo, portanto, fator decisivo no desenvolvimento

de cidades mais dinâmicas, sustentáveis e saudáveis.

Page 30: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

21 3 TRANSFORMADO DADOS EM INFORMAÇÃO

As cidades ao redor do mundo estão constantemente coletando dados da vida

urbana os quais contribuem para a geração de informação útil aos cidadãos, visitantes,

autoridades públicas e trabalhadores locais (CARAGLIU et al., 2011). Com o

crescimento da internet e uso massivo da tecnologia de informação e comunicação (TIC),

a quantidade de dados gerados e disponibilizados cresceu exponencialmente (AVILA,

2017). A Figura 9 mostra essa tendência e indica que, até este ano, esse número deve

chegar na casa dos 40 Zettabytes (ou 40 trilhões de gigabytes).

No atual contexto da transformação digital, o efetivo uso desse grande volume de

dados, conhecido atualmente como Big Data, terá capacidade de transformar economias,

otimizar processos produtivos e será peça chave na consolidação de empresas

competitivas no mercado (MANYKA et al., 2011).

Figura 9 – Volume de dados gerados no mundo de 2010 a 2020 (AVILA, 2017)

O Big Data tipicamente descreve um largo e complexo conjunto de dados

representados digitalmente por registros da atividade humana. Ele pode ser definido em

termos de escala e volume, ou pelos seus impactos nas organizações. As análises de Big

Data envolvem processos cognitivos e computacionais para identificar padrões nos dados

Page 31: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

22 e Kumar et al., (2013) dizem que o correto uso desses dados pode beneficiar as relações

entre empresas, clientes e a sociedade nos sistemas inteligentes.

Por outro lado, até recentemente, muita dessa informação desaparecia. Ou não era

coletada, ou era descartada (HAIR et al., 2005). Segundo Gantz e Reinsel (2012), apesar

da porção do universo digital contendo valor analítico estar crescendo, apenas uma

pequena parte dele é de fato explorada.

Assim, frente a esse enorme volume de informação disponível, o grande desafio

passa ser como selecionar e gerir esses dados de tal maneira que possamos transformá-

los em informação e conhecimento eficaz (HAIR et al., 2005).

Diante desse cenário, muito se tem discutido a respeito das cidades inteligentes

como uma nova proposição para o gerenciamento das cidades, valendo-se do intenso uso

das tecnologias da informação e comunicação como meio para viabilizar as cidades do

futuro e equalizar as questões trazidas pela rápida urbanização.

CIDADES INTELIGENTES

O século XXI está sendo marcado por importantes fenômenos sociais e,

principalmente, por grande concentração de pessoas em ambientes estritamente urbanos

(ONU, 2012). Até 2050, projeta-se que o número de pessoas no mundo deve chegar a

casa dos 9 bilhões e, desta população, estima-se que cerca de 66% estarão vivendo em

cidades (Figura, 10) (ONU, 2012). As cidades garantem aos seus habitantes diversas

facilidades da vida urbana (como cultura, lazer, transporte público, saúde, etc...), mas, por

vezes, elas não estão preparadas para atender a demanda necessária (ANDRADE et al.,

2016).

Figura 10 - Tendências de urbanização global: porcentagem da população morando em

áreas urbanas (DELLOITE, 2017)

Page 32: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

23

O rápido fluxo de pessoas em direção aos centros urbanos e o adensamento

populacional trazem consigo desafios enormes para os governos, pois nem sempre a

infraestrutura urbana acompanha o crescimento das cidades. Esses desafios, decorrentes

da imediata necessidade de atendimento às demandas por serviços adequados, estimulam

a criação de novas áreas de conhecimento para a prevenção ou solução dos problemas

decorrentes desse fenômeno. (ANDRADE et al., 2016; BERNARDES et al., 2017).

Um desafio significativo vivido atualmente por grande parte das cidades diz

respeito à mobilidade urbana. Com o crescimento desordenado das cidades e a

especulação imobiliária nos centros, cada vez mais pessoas se instalam em periferias,

exigindo, assim, que a infraestrutura chegue até esses locais. Portanto, a mobilidade

urbana deve ser pensada com o mesmo dinamismo do desenvolvimento urbano, para que

se atendam as necessidades atuais, mas se tenha alternativas para a demanda futura

(ANDRADE et al., 2016).

Discutir as cidades, então, torna-se um tema crítico e de grande importância,

particularmente com vistas ao cenário futuro de crescimento populacional nos centros

urbanos (BERNARDES et al., 2017). A busca por soluções inteligentes para o

enfrentamento dos desafios relacionados a forte urbanização e seus impactos traz o

conceito de Cidades Inteligentes (Smart City), que é envolvido em uma nova abordagem

para mitigar e tratar os problemas nas cidades, visando que as mesmas sejam mais

sustentáveis e que contem com a efetiva participação da população em sua construção e

desenvolvimento (ANDRADE et al., 2016).

Já existem muitos projetos de cidades inteligente, como o Oceanix, Masdar e

XCloud. E recentemente, a Toyota anunciou a criação da Woven City, uma cidade

inteligente na base do monte Fuji que terá um ecossistema totalmente conectado e

sustentável. Mas fato é que nem todas as cidades podem ser reconstruídas do zero, então

a pergunta que fica é: como podemos transformar as cidades de hoje em cidades

inteligentes? (FIRJAN, 2019).

Construir cidades inteligentes significa entender de forma plena as

particularidades de cada região e, independentemente delas, atender às necessidades de

interação cidadão-governo, que é crescente e absolutamente crítica (WOLFRAM, 2012).

Portanto, o desenvolvimento da inteligência nas cidades está associado às características

individuais de cada uma, traduzidas em sistemas de informações robustos, plenamente

integrados e que se valham dos avanços promovidos pela indústria de tecnologia da

Page 33: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

24 informação. As aplicações da TIC para a criação de cidades inteligentes são inúmeras e

começam a ser disponibilizadas de forma adaptada às necessidades de cada centro urbano,

com objetivo de solucionar problemas e adaptar a infraestrutura existente (WOLFRAM,

2012).

3.1.1 Digitalização e Cidades inteligentes

Se nos anos 1990 o debate entre as novas tecnologias de informação e

comunicação e o espaço urbano girava em torno do termo “cidades digitais”, hoje o termo

emergente é “cidades inteligentes”. O digital era compreendido como o acesso aos

computadores e à implantação da internet no espaço urbano, mas inteligente aqui é

sinônimo de uma cidade onde tudo é sensível ao ambiente e produz, consome e distribui

uma grande quantidade de informações em tempo real (LEMOS, 2013).

Assim, enquanto as cidades digitais são caracterizadas por aspectos puramente

técnicos, as definições para as cidades inteligentes vão além. De acordo com Dutta et al.

(2011), as cidades inteligentes têm foco em um modelo particularizado, com visão

moderna do desenvolvimento urbano e que reconhecem a crescente importância das

tecnologias da informação e comunicação no direcionamento da competitividade

econômica, da sustentabilidade ambiental e da qualidade de vida geral. “As cidades são consideradas inteligentes quando são

identificadas contendo investimentos inteligentes ao longo dos

eixos: economia, mobilidade, meio ambiente, recursos humanos e

estilos de vida inteligentes. Os significativos avanços tecnológicos

e das tecnologias da informação e comunicação (TIC) agora fazem

das plataformas tecnológicas embarcadas um instrumento

potencialmente significativo para sensorizar e monitorar a

funcionalidade e o desempenho das cidades, permitindo ampliar

sobremaneira suas capacidades de gerenciar recursos com mais

eficiência e prover conectividade e informações de forma

transparente aos seus cidadãos e visitantes.” (C40 SÃO PAULO

CLIMATE SUMMIT, 2011, p. 32)

Essa evolução de paradigmas ocorreu, principalmente, por causa da popularização

da internet e o agressivo desenvolvimento de sistemas de geolocalização, acesso,

consumo e distribuição de informação, permitindo que os usuários participassem da

Page 34: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

25 criação de conteúdo. Atualmente, a partir de terminais móveis (como tablets e

smartphones) é possível ter acesso à internet, ao desenvolvimento e utilização de

aplicativos e, principalmente, à informação em tempo real, o que contribuiu para que as

cidades inteligentes se disseminassem (ANDRADE et al., 2016; LEMOS, 2013).

A TIC aparece, então, como viabilizadora de um sistema nervoso para as cidades

inteligentes, tornando os dados da vida urbana tangíveis por meio da criação e execução

de projetos voltados para sua captura e tratamento em tempo real. Além disso, o

processamento de dados inteligente é usado como base para as tomadas de decisões de

empresas, governos e cidadãos. A TIC fornece, portanto, as interfaces adequadas para

que os cidadãos se envolvam com sua cidade e para que o poder público possa atuar de

forma preventiva por meio do uso de sistemas de monitoramento, gerenciamento e painéis

analíticos (LEMOS, 2013; BERNARDES et al., 2017).

Segundo Finger (2017), enquanto as cidades tradicionais apresentam duas

camadas principais, a de infraestrutura e de serviços, as cidades inteligentes incorporam

mais uma camada entre essas duas, a dos dados. Nas cidades inteligentes, há, portanto,

uma combinação dos sistemas urbanos e da digitalização das informações, que ocorre em

três etapas: geração, conexão e análise dos dados.

A etapa de geração de dados se dá a partir dos diferentes dispositivos móveis

utilizados, como GPS, smartphones, satélites, etc. Com o crescimento da Internet das

Coisas e maior acessibilidade da população à tecnologia da informação, a quantidade de

dados gerados aumentou exponencialmente, inclusive nas cidades. A segunda etapa

refere-se à própria Internet, que funciona como infraestrutura onde todos esses dados

estão disponíveis e acessíveis. Por fim, a terceira etapa está ligada a capacidade de

processamento e análise dessa grande quantidade de dados a fim de torna-la útil (LUZ,

2018).

Neste sentido, novas ferramentas, como machine learning e a inteligência

artificial, estão sendo desenvolvidas para processar e analisar esse grande volume de

dados (Big Data) e apresentá-los de forma inteligível.

A principal implicação da digitalização nas cidades é a gestão inteligente das

infraestruturas urbanas, aumentando a eficiência e otimizando as cadeias de valor. A

segunda grande implicação é o desenvolvimento de serviços inteligentes e novos modelos

de negócios utilizando a camada dos dados (FINGER et. al., 2017).

Page 35: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

26 SISTEMAS INTELIGENTES DE SERVIÇO

Os sistemas de serviços inteligentes são definidos por Medina-Borja (2015) como

aqueles em que há aprendizado, constante adaptação e tomada de decisão baseada em

recebimento, transmissão e processamento de dados. Nesse sentido, estudos revelam que

a análise de Big Data pode contribuir para inovar e potencializar as aplicações desses

serviços (MAGLIO e LIM, 2016).

Fabricantes de automóveis analisam as condições dos veículos e os dados

coletados por serviços de bordo para gerar informação aos motoristas, como a eficiência

do motor, segurança, consumo e navegação (LIM et al., 2015). Consumidores do varejo

estão sempre alimentando dados de lojas, cujas análises podem revelar padrões de

consumo relevantes e ajudar a desenvolver novos serviços e aprimorar os existentes. As

redes sociais (Facebook, Instagram, Twitter e blogs) analisam o comportamento de seus

usuários para direcionar anúncios e criar redes cada vez mais alinhadas com os interesses

dos indivíduos. Esses são só alguns exemplos de sistemas inteligentes que permitem

extrair informações a partir da análise de Big Data (MAGLIO e LIM, 2016).

Figura 11 - Quatro usos de Big Data em sistemas inteligentes de serviço (MAGLIO e

LIM, 2016)

Page 36: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

27 Os casos de análise de Big Data em sistemas inteligentes de serviço podem ser

divididos em quatro quadrantes como mostra a Figura 11. Essa categorização é feita de

acordo com a origem dos dados, se são coletados majoritariamente dos usuários ou de

objetos do sistema, e de acordo com a finalidade do uso, se são usados para gerar

informação às pessoas ou para gerir os próprios objetos (MAGLIO e LIM, 2016):

1. Gestão inteligente de operações

Categoria caracterizada por dados obtidos de objetos e destinados a gestão dos

mesmos. Casos nessa categoria têm como objetivo aperfeiçoar os processos de operação

de um determinado sistema de serviço. Busca-se um controle eficiente e eficaz dos

sistemas por meio do profundo entendimento dos mesmos através da análise de dados.

São exemplos os serviços inteligentes de coleta de lixo, que obtém dados de caçambas

usando etiquetas de identificação por rádio frequência, e planejam as rotas e horários de

coleta; ou o controle de tráfego inteligente em Cingapura, que coleta dados de ruas e taxis

para prever demandas futuras e controlar sinais de trânsito de forma eficiente (MAGLIO

e LIM, 2016).

2. Customização e prevenção inteligente

Estes casos se baseiam em dados obtidos das pessoas para gerir os objetos do

sistema. Através da análise dos dados, busca-se entender as questões e necessidades dos

usuários de um determinado sistema de serviço para, então, customizar a operação do

sistema de acordo com essas necessidades (MAGLIO e LIM, 2016). Muitos casos de

cidades inteligente correspondem a esta categoria (CARAGLIU et al., 2011). À exemplo,

tem-se: o sistema de prevenção de crimes em São Francisco, em que os registros de crimes

são usados para prever locais de prováveis novas ocorrências e definir localização de

patrulhas (MAGLIO e LIM, 2016); e o serviço de ônibus noturnos de Seoul, que analisa

as chamadas telefônicas e os dados de uso de táxi dos moradores e visitantes da cidade

para identificar o comportamento de deslocamento das pessoas no período da noite e

poder otimizar as rotas e horários dos ônibus noturnos (MAGLIO e LIM, 2016).

3. Treinamento inteligente

Esta categoria engloba os casos em que são analisados dados de pessoas e cuja

finalidade é providenciar treinamento baseado em evidências ou desenvolver controle de

Page 37: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

28 processos baseado em profundo conhecimento do comportamento humano (MAGLIO e

LIM, 2016). Exemplos representativos dessa categoria incluem a gestão de jogadores,

que envolve avaliação e melhoria do condicionamento de atletas usando dados detalhados

de suas próprias atividades ao longo do tempo; acessórios esportivos de controle de

atividade, que coletam diariamente dados dos usuários e os ajudam a traçar metas; e

serviços de monitoramento de bebês, que coletam dados dos bebês e do ambiente externo

para informar aos pais as condições em que se encontram e prever comportamentos

(MAGLIO e LIM, 2016).

4. Adaptação inteligente e controle de risco

Por fim, esta categoria envolve a coleta de dados de objetos para ajudar as pessoas.

Casos nesta categoria têm como objetivo a análise de dados de serviços que afetam a vida

das pessoas para que elas possam adaptar os objetos do sistema e reduzir riscos. São

exemplos: navegação inteligente em Milão, que analisa dados de fatores que afetam o

trânsito na cidade, como acidentes, condição do tempo, construções e eventos, para gerar

informação de navegação aos cidadãos e visitantes; e serviços de planejamento de frotas,

que recolhem dados das operação de transporte de caminhões e analisam essas

informações para melhorar a eficiência e produtividades das operações para os motoristas

(MAGLIO e LIM, 2016).

Com a possibilidade de tudo estar conectado, novos projetos voltados para cidades

inteligentes ganham um espaço cada vez maior e podem trazer além de ganhos para o

governo, benefícios para as pessoas. A interação de sistemas, principalmente em áreas

relacionadas à mobilidade urbana, permitirá maior comodidade, segurança, redução de

custos e de recursos naturais (MAGLIO e LIM, 2016).

ANÁLISE DE BIG DATA E A MOBILIDADE URBANA

Nos dias atuais, os sistemas de planejamento de mobilidade urbana contam com

uma grande vantagem: a disponibilidade de dados somada à tecnologia avançada para

processá-los e analisá-los. Governos e operadores de transporte podem usar esse amplo

conjunto de dados (como registro de viagens pendulares, dados de ônibus, de metrôs e

dos impactos de grandes eventos nos transportes) para gerar informação às áreas de

planejamento, gestão e operação de transportes de uma cidade. Além disso, informações

em tempo real geram soluções rápidas para monitorar e regular fluxos de veículos,

Page 38: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

29 planejar rotas e notificar ocorrência de acidentes, por exemplo (ELLEN MACARTHUR

FOUNDATION, 2019).

Outro ponto importante é entender os benefícios sociais e o valor econômico por

trás da disponibilização de dados públicos a respeito da mobilidade. Nesse contexto, a

atuação de iniciativas privadas, dos próprios cidadãos e dos órgãos públicos em conjunto

se torna essencial para alavancar o desenvolvimento de serviços inteligentes de

mobilidade, responsáveis, por exemplo, por incentivar mobilidade sustentável nos centros

urbanos (DELLOITE, 2017).

Com a popularização aparelhos eletrônicos portáteis, que permitem rastrear os

deslocamentos dos indivíduos na cidade, abre-se uma janela de oportunidades para

políticas de planejamento baseadas em dados. No entanto, apesar de ser comumente

aceito que existe um grande valor analítico por trás desses dados, não se tem uma maneira

pré-definida e correta para traduzi-los em informação útil e em mudanças concretas

(TRACE, 2019), o que aumenta a necessidade de debates e pesquisas a respeito do tema.

Um caso interessante e que abriu espaço para o debate sobre o valor por trás desses

dados é o de Londres. Há cerca de 10 anos, o TfL (Transport for London), órgão

responsável pelo controle do sistema de transporte da Grande Londres, decidiu

disponibilizar uma significativa quantidade de dados em formato aberto para que

qualquer pessoa pudesse ter acesso a eles, e sem nenhum tipo de cobrança. O objetivo era

estimular a produção de novos produtos e serviços para que fossem levados rapidamente

a mercado e, por conseguinte, fortalecesse o próprio canal de troca de informação da TfL.

O resultado foi a criação de mais de 600 aplicativos desenvolvidos a partir dos dados

disponíveis, usados no decorrer do tempo por até 42% dos londrinos, além de uma série

de benefícios para as partes interessadas (DELLOITE, 2017).

Dentre os benefícios para os usuários da rede de mobilidade pode-se citar a

otimização do tempo e o melhor planejamento de viagens, que se torna mais preciso e

confiável devido às informações disponíveis em tempo real. A cidade de Londres ganha

com o crescimento econômico das empresas de mobilidade e maior geração de empregos.

Por fim, o TfL também se beneficia, tanto com uma economia financeira, já que os

aplicativos não são produzidos internamente e sim por terceiros, quanto com aumento das

oportunidades comerciais e de parcerias que agregam valor mútuo (DELLOITE, 2017).

No cenário atual, a TfL tem a oportunidade de disponibilizar ainda mais dados e

fortalecer outras parcerias com o intuito de explorar e estimular o desenvolvimento de

serviços inovadores e de melhorar a experiência dos usuários no transporte.

Page 39: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

30 Também nesse contexto, pode-se destacar o projeto TRACE, que surgiu nos

últimos anos com o objetivo de fomentar o uso da mobilidade ativa nas cidades. Para

tanto, o projeto servia-se da análise dos dados de serviços de rastreamento e navegação,

assim como do desenvolvimento de ferramentas de mobilidade próprias, que gerassem

informação sobre o comportamento dos usuários (TRACE, 2019).

O projeto surgiu, portanto, com o foco de determinar medidas que incentivassem

os deslocamentos a pé e de bicicleta nas viagens a trabalho, estudo e a lazer. E essas

medidas puderam ser aprimoradas com o uso das ferramentas do TRACE, tanto as

relacionadas à mudança de comportamento (Biklio, Positive Drive, Traffic Snake Game),

quanto as ligadas ao suporte aos planos de mobilidade (TATto). Esses aplicativos foram

testados em 8 cidades piloto e avaliadas em termos de seus impactos (TRACE, 2019).

Como um todo, o projeto TRACE permitiu o desenvolvimento de uma ampla base

de conhecimento a respeito das possibilidades, soluções e benefícios que permeiam o

rastreamento de viagens realizadas por bicicleta e á pé. Além disso, as ferramentas criadas

e dados disponibilizados puderam ser explorados pelo mercado da tecnologia de

comunicação e informação e por usuários interessados (TRACE, 2019).

A partir da interpretação dos resultados do projeto, pôde-se categorizar os

objetivos que envolvem o rastreamento de deslocamentos por bicicleta e a pé em 4

grupos: 1. Conectar interesses das partes envolvidas: parceiros (lojas, teatros, cinemas,

seguradoras, etc.) podem oferecer recompensas aos usuários que, por exemplo, chegam

até um estabelecimento de bicicleta ou mantém hábitos saudáveis; 2. Análise de dados:

são extraídas informações a respeito do nível de serviço das infraestruturas existente, dos

caminhos de preferência e da quantidade de demanda por horário; 3. Monitoramento de

medidas: avaliação detalhada dos impactos gerados pela implantação de novas rotas,

radares, sinalização, ou por canteiros de construção na mobilidade urbana, e; 4.

Ferramenta de comunicação: aumentar a visibilidade de ciclistas e pedestre para

autoridades e o público em geral, como forma de influenciar tomadas de decisão em prol

da mobilidade sustentável e ativa (TRACE, 2019).

3.3.1 O Aplicativo BIKLIO

Os dados utilizados neste trabalho foram extraídos de uma base de registros das

viagens realizadas pelos usuários do aplicativo BIKLIO. O aplicativo pode ser instalado

Page 40: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

31 em qualquer smartphone e oferece uma plataforma onde ciclistas de uma cidade podem

se conectar com outros ciclistas e com estabelecimentos comercias parceiros, de forma a

fortalecer uma economia local sustentável. Hoje, a BIKLIO é uma startup presente em 7

países diferentes da Europa (Figura 12).

Figura 12 - Cidades onde a BIKLIO está presente

O modelo de negócio da BIKLIO consiste na oferta de benefícios para usuários

do aplicativo que optam por se locomover de bicicleta. Na visão da empresa, há 3 agentes

que podem ser impactados positivamente com a oferta deste serviço: os ciclistas, o

comerciante e a cidade (Figura 13).

Figura 13 – Agentes impactados pelo app BIKLIO

Sob o ponto de vista do ciclista, o mesmo pode mapear quais benefícios estão

sendo oferecidos próxima a sua localização atual. Caso o deslocamento até o

estabelecimento parceiro (BIKLIO spot) seja realizado por meio da bicicleta, o aplicativo

identificará a viagem e o usuário poderá resgatar sua oferta (Figura 14).

Para o comerciante, o aplicativo é uma forma de aumentar a visibilidade da marca

e de direcionar seus benefícios para um público específico, a fim de aumentar as chances

de fidelização de um cliente. O perfil dos ciclistas varia de cidade para cidade, mas, em

Page 41: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

32 geral, pode-se dizer que são pessoas que se preocupam com o desenvolvimento

sustentável e seguem um estilo de vida mais saudável. Nesse sentido, estabelecimentos

que praticam valores parecidos podem encontrar, na plataforma, clientes que criem

identificação com seus produtos mais facilmente.

Figura 4 – Esquema de obtenção de benefício no BIKLIO

Sob a perspectiva da produção de dados, é fácil compreender que os usuários do

BIKLIO estão constantemente alimentando a base do aplicativo. A medida que alguém

utiliza o app, as informações sobre o deslocamento são automaticamente armazenadas no

sistema. Ainda, é possível extrair informações a respeito do perfil dos usuários e dos

estabelecimentos comerciais parceiros.

Nesse sentido, pode-se concluir que os dados armazenados pelo aplicativo contém

alto valor analítico e, caso sejam bem manipulados, podem fornecer informações

extremamente úteis, tanto para os desenvolvedores da ferramenta como para instituições

de pesquisa. Isso porque identificar as rotas de preferência dos ciclistas pode ser relevante

na compreensão dos fatores mais relevantes na escolha dos percursos das viagens por

bicicleta, se são aqueles com melhor infraestrutura, mais agradáveis, ou simplesmente

mais rápidos. Além disso, sabendo-se por qual tipo de oferta cada usuário se sente mais

atraído, é possível personalizar o direcionamento de novos benefícios. Ainda, entender os

horários de maior circulação de ciclistas pode ajudar a orientar políticas públicas de

incentivo à bicicleta, como criação de faixas exclusivas e serviços de carregamento de

bicicletas a bordo.

Page 42: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

33 4 ANÁLISE MULTIVARIADA

CONCEITOS DE ÁLGEBRA MATRICIAL

Este trabalho explora o uso da análise de componentes principais, uma técnica

multivariada, na interpretação de uma base de dados de usuários de bicicleta. O

entendimento desta técnica está atrelado a aplicação da álgebra matricial básica, em que

são avaliados os autovetores e autovalores de uma matriz de covariância ou uma matriz

de correlações (PITOMBO e LINDNER, 2016).

4.1.1 Autovalores

Dada uma matriz quadrada ! de ordem ", com entradas reais, pode-se dizer que

os autovalores de ! correspondem aos valores de $ ∈ ℝ que satisfazem a solução não

trivial (( ≠ 0) da Equação (4.0):

! ∙ ( = $ ∙ ( (4.0)

onde ( é um vetor de dimensão (" × 1) e $ é um escalar.

Os " autovalores {$1, $3, $4, ⋯ , $6} da matriz ! podem ser calculados através das

raízes do seu polinômio característico definido por (4.1):

8(λ) = det(! − $>) (4.1)

sendo > uma matriz identidade de dimensões (" × ").

A equação det(! − $>) = 0 é também conhecida como equação característica e,

pelas propriedades dos determinantes, 8 é um polinômio de grau ", igual a ordem da

matriz !.

Page 43: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

34 4.1.2 Autovetores

O vetor coluna (? que satisfaz a Equação (4.0) é definido como sendo o autovetor

à direita da equação ! associado ao autovalor $?. Para as " soluções possíveis, a Equação

(4.0) pode ser genericamente expressa da seguinte forma:

! ∙ (? = $? ∙ (?@ = {1,2,⋯ , "} (4.2)

onde (? é um vetor de dimensão (" × 1).

(? = B

(1?(3?⋮(6?

D (4.3)

Geometricamente, (E⃗ é um vetor que não muda de direção quando se aplica a

matriz !. Como pode ser ilustrado na Figura 15, o autovetor é levado a um múltiplo de si

mesmo.

Figura 13 – Interpretação geométrica de um autovetor

O conjunto formado pelos autovetores à direita da matriz ! é representado pela

matriz ( a seguir:

( = [(1 (3 ⋯ (? ⋯ (6] (4.4)

Page 44: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

35 4.1.3 Matrizes de covariância e correlação

De forma geral, tanto a covariância quanto a correlação medem o grau de relação

e dependência entre variáveis. No entanto, enquanto a covariância mede apenas a direção,

o coeficiente de correlação mede tanto a força quanto a direção da relação linear entre

duas variáveis.

O coeficiente de correlação é uma função da covariância e seus valores são

padronizados, variando de -1 a 1. Ele pode ser obtido dividindo-se a covariância pelo

produto dos desvios padrão das variáveis. Portanto, valores positivos de covariância

sempre resultarão em valores positivos de correlação e o mesmo se aplica aos valores

negativos (MINITAB, 2019).

Para duas variáveis x e y, as fórmulas para o cálculo dos coeficientes de

covariância e correlação são dadas, respectivamente, pelas Equações (4.5) e (4.6).

IJK(L, M) =∑ (L? − L̅)(M? − MP)6?Q1

" − 1 (4.5)

IJRR(L, M) =Ε[(L? − L̅)(M? − MP)]

TUTV (4.6)

onde:

L̅ é a média aritmética da variável x;

MP é a média aritmética da variável y;

TU é o desvio padrão da variável x;

TV é o desvio padrão da variável y.

4.1.3.1 Matriz de Covariância

A matriz W (" × X) exemplificada em (4.7) pode ser interpretada como uma matriz

de variáveis, na qual cada coluna LY representa um vetor contendo " coletas de uma

variável Z.

Page 45: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

36

W = B

L11 L13 ⋯ L1[L31 L33 ⋯ L3[⋮ ⋮ ⋱ ⋮L61 L63 ⋯ L6[

D (4.7)

Dessa forma, cada elemento ]?Y da matriz de covariância ^ (4.8) representa a

covariância entre as i-ésima e j-ésima variáveis da matriz W e pode ser calculado pela

Equação (4.5), na qual L̅ e MP são as médias aritméticas dos elementos das colunas L? e LY

da matriz W, respectivamente. Como ]?Y = ]Y?, a matriz de covariância obtida é uma

matriz simétrica de ordem X.

^ = B

]11 ]13 ⋯ ]1[]31 ]33 ⋯ ]3[⋮ ⋮ ⋱ ⋮][1 ][3 ⋯ ][[

D (4.8)

4.1.3.2 Matriz de Correlação

Partindo da base de dados da matriz W, a matriz de correlação _ (4.9) pode ser

obtida usando-se a mesma lógica do cálculo da matriz de covariância, mas, desta vez,

aplicando-se a Equação (4.6).

Nota-se que a matriz _ continua sendo uma matriz quadrada, simétrica e de ordem

X, porém os valores de seus elementos foram normalizados, variando de -1 a 1, e são

adimensionais. Vale ressaltar, também, que a diagonal principal da matriz de correlação

_ é composta apenas por elementos unitários, o que faz sentido já que a correlação de

uma variável com ela mesma deve retornar o maior valor possível.

_ =

⎣⎢⎢⎡1 R13 ⋯ R1[R31 1 ⋯ R3[⋮ ⋮ ⋱ ⋮R[1 R[3 ⋯ 1 ⎦

⎥⎥⎤ (2.0)

Page 46: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

37 TÉCNICAS MULTIVARIADAS

As análises de Big Data, normalmente, podem ser estruturadas utilizando-se

métodos estatísticos simples. Todavia, quando busca-se ampliar o entendimento a

respeito de um determinado assunto, muitas vezes é necessário que sejam consideradas

em uma análise diversas variáveis (CARVALHO, 2017). Nesses casos, avanços

tecnológicos ligados ao desenvolvimento de hardwares e softwares vêm nos ajudando a

aplicar técnicas multivariadas mais complexas.

As técnicas de análise multivariadas são definidas como as técnicas estatísticas

em que se avaliam simultaneamente múltiplas medidas sobre o mesmo objeto de

investigação. Ademais, para que a análise seja considerada multivariada, todas as

variáveis devem ser aleatórias e inter-relacionadas de tal forma que seus efeitos não

possam ser significativamente interpretados isoladamente (HAIR et al., 2005).

Alguns autores declaram, ainda, que o propósito da análise multivariada é medir,

explicar e predizer o grau de relacionamento entre as variáveis, por isso sua característica

multivariada repousa nas combinações e não somente na quantidade de observações e

variáveis (HAIR et al., 2005).

Para Hair et al (2005), a escolha da técnica multivariada mais adequada para cada

análise depende das respostas para três perguntas:

1. As variáveis podem ser dividas em classificações independentes e

dependentes com base em alguma teoria?

2. Se podem, quantas variáveis são tratadas como dependentes em uma única

análise?

3. Como as variáveis, sejam dependentes ou independentes, são medidas?

A resposta à primeira questão indica se uma técnica de dependência ou

independência deveria ser usada. É possível observar na Figura 2 que esta avaliação

define qual caminho deverá ser tomado no primeiro ponto de decisão, a partir do qual se

estabelece uma separação entre o lado esquerdo (dependência) e o direito

(interdependência).

Em linhas gerais, uma técnica de dependência é aquela na qual uma variável ou

um conjunto de variáveis é identificada como a variável dependente a ser prevista ou

explicada por outras variáveis conhecidas independentes. As técnicas de dependência

podem ser classificadas de acordo com o número de relações de dependência e, também,

conforme o tipo de escala empregada pelas variáveis. São exemplos dessa técnica a

Page 47: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

38 análise de correlação canônica, a regressão múltipla e a análise de variância multivariada

(MANOVA).

Por outro lado, as técnicas de independência são aquelas em que não há uma

variável ou grupo de variáveis definida como sendo dependente ou independente. Os

procedimentos envolvem a análise simultânea de todas as variáveis do conjunto (HAIR

et al, 2005).

Figura 14 - Seleção de uma técnica multivariada (HAIR et al, 2005)

Page 48: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

39

Figura 15 - Seleção de uma técnica multivariada (HAIR et al, 2005)

Como o objetivo deste trabalho é analisar uma estrutura de variáveis

independentes, seguindo o lado direito do diagrama apresentado nas Figuras 16 e 17, a

técnica mais apropriada para ser utilizada segundo Hair et al (2005) é a análise fatorial.

A estruturação da análise de dados deste trabalho foi feita com a utilização da

metodologia de análise de componentes principais (ACP), que muitas vezes aparece na

literatura como um caso especial da análise fatorial, mas que Jolliffe (2002) defende que

são técnicas distintas, mesmo apresentado escopos muito parecidos.

Nas próximas seções, serão apresentados os princípios básicos dos dois métodos,

com maior detalhamento para o método da análise de componentes principais.

Page 49: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

40 ANÁLISE DE COMPONENTES PRINCIPAIS

4.3.1 Definição

O Análise de Componentes Principais (ACP) é uma técnica multivariada que tem

por objetivo reduzir a dimensão de uma base de dados composta por um grande número

de variáveis correlacionadas, com menor perda de informação possível (JOLLIFFE,

2002). Segundo Souza (1995), a ACP procura explicar uma estrutura de variâncias-

covariâncias utilizando poucas combinações lineares das variáveis originais a fim de

simplificar a interpretação dos dados, colocando-os em uma forma mais adequada para

análise e facilitando a evidenciação de tendências.

É comumente aceito que a técnica de componentes principais foi originalmente

descrita por Pearson (1901) na busca por linhas e planos que melhor descrevessem um

conjunto de pontos em um espaço p-dimensional. Posteriormente, ela foi consolidada na

análise de estruturas de correlação por Hotelling (1933). A motivação de Hotelling estava

na possível existência de um conjunto menor de variáveis independentes que pudessem

caracterizar bem os valores das variáveis originais. Ele observou que essas novas

variáveis eram chamadas de “fatores” em estudos anteriores desenvolvidos na área da

psicologia, mas propôs a introdução do termo alternativo “componentes” para evitar

confusões nos estudos da matemática, que já tinha outras atribuições para a palavra

“fatores”. Ainda, ele nomeou de “componentes principais” aqueles que melhor

conseguiam explicar de maneira significativa a estrutura e variância da base de dados

original. A análise feita para se identificar esses componentes ficou conhecida como

“método de componentes principais” (JOLLIFFE, 2002).

Segundo Jolliffe (2002), a ACP é a técnica de redução dimensional mais

conhecida e usada mundialmente quando se busca diminuir o número de variáveis, devido

a sua relativa fácil aplicação em problemas numéricos. Entretanto, considera-se que os

cálculos que envolvem a aplicação da ACP sejam viáveis de serem executados a mão

apenas quando são analisadas até no máximo 4 variáveis. Por isso, o uso dessa análise só

foi amplamente difundido após o desenvolvimento de computadores eletrônicos e graças

a ampla disponibilidade de softwares aplicados, permitindo sua utilização em várias áreas

da ciência (SOUZA, 1995).

Apesar de ser uma técnica aparentemente simples de ser aplicada, muitas

pesquisas relacionadas a ACP vêm sendo desenvolvidas. Hoje é possível encontrar na

Page 50: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

41 literatura exemplos de aplicações da ACP em diversas áreas como agricultura, biologia,

química, estudos demográficos, ecologia, genética, psicologia, estudos de rotinas, dentre

muitas outras (JOLLIFFE, 2002).

4.3.2 Interpretação algébrica

A análise de componentes principais tem como ponto de partida uma base de

dados contendo X variáveis aleatórias e " observações/amostras. Esses dados podem

organizados em linhas e colunas e representados pela matriz de variáveis W (1.8).

Para Sartorio (2008), a técnica da ACP consiste basicamente em transformar um

conjunto original de variáveis aleatórias (W1, W3, W4,⋯ ,W[) em um outro conjunto com

mesma dimensão (f1, f3, f4,⋯ , f[), tal que:

f? = g?1W1 + g?3W3 + ⋯+ g?[W[ (2.0)

Onde:

f? é um vetor coluna com " elementos

Os elementos desse novo conjunto são variáveis não correlacionadas e cada um

está associado a um componente principal que, algebricamente, é uma combinação linear

das X variáveis aleatórias W1, W3, W4,⋯ ,W[ (SOUZA, 1995).

O componente principal f1 é o arranjo que melhor representa a distribuição dos

dados e que retém a maior quantidade de informação da base, seguido pelo f3, e assim

por diante. A importância dos componentes principais é dada pelas suas respectivas

variâncias e são ordenados conforme (2.1) (SOUZA, 1995).

igR(f1) > igR(f3) > ⋯ > igR(f[) (2.1)

onde:

igR(f?) denota a variância de f?

A solução de maximização do problema e tão logo a determinação dos

componentes principais está atrelada a aplicação de conceitos básicos da álgebra linear e

recai sobre a identificação dos autovalores e autovetores da matriz de covariância ^,

descrita no capítulo anterior (JOLLIFFE, 2002).

Page 51: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

42 Segundo Manly (2005), o autovalor $? da matriz de covariância ^ corresponde à

variância do componente principal f?. Neste caso, ele diz que igR(f?) = $? e, como não

é possível obter valores negativos associados aos autovalores de uma matriz de

covariância, os X autovalores da matriz S assumem valores maiores ou iguais a zero e são

ordenados da seguinte forma:

$1 ≥ $3 ≥ $4 ≥ ⋯ ≥ $[ ≥ 0 (2.2)

As constantesg?1, g?3, ⋯ , g?[ são os elementos do autovetor (? associado ao

autovalor $? damatrizdecovariância^. A análise dos autovetores se faz relevante na

medida em que os seus elementos representam os “pesos” de importância que cada

variável original W? tem dentro de cada componente principal. As constantes g?Y são

definidas pela combinação linear que retorna o maior valor de igR(f?) possível, sujeita

a restrição (2.3). A colocação dessa restrição é necessária pois, em caso contrário, a

igR(f?) cresceria indefinidamente com o aumento do valor de qualquer constante g?Y

(MANLY, 2005).

g?13 + g?33 +⋯+ g?[3 = 1 (2.3)

Uma importante propriedade dos autovalores é que a soma de seus valores é igual

a soma dos elementos da diagonal da matriz de origem, no caso, ̂ (1.9) (MANLY, 2005).

Dessa forma, tem-se que:

$1 + $3 + $4 +⋯+ $[ = ]11 + ]33 + ]44 + ⋯+ ][[ (2.3)

Como o elemento ]?? corresponde a variância de W? e $? corresponde a variância

de f?, a equação (2.3) indica que a soma das variâncias dos componentes principais é

igual a soma das variâncias da base de dados original (MANLY, 2005). Ainda, no caso

particular da matriz de correlação _, cujos elementos da diagonal principal são todos

unitários, tem-se que:

v$?

[

?Q1

=v]YY

[

YQ1

= X (2.4)

As componentes principais também podem ser caracterizadas de acordo com a sua

importância relativa, ou seja, ela passa a ser avaliada pela porcentagem de sua variância

Page 52: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

43 correspondente sobre a soma total das variâncias. Para Manly (2005), em certos estudos,

por exemplo, é desejável que a variância acumulada nos dois primeiros componentes

principais exceda 70-80%.

4.3.3 Interpretação geométrica

A análise de componentes principais também pode ser interpretada por uma

perspectiva espacial e geométrica. A Figura 18 representa a plotagem de 50 observações

feitas com relação a duas variáveis fortemente correlacionadas L1, L3. É claro que os casos

em que X = 2 são bem simples e pouco realistas, mas para fins visualização, eles têm a

vantagem de poderem ser graficamente apresentados em apenas 2 dimensões (JOLLIFFE,

2002).

Figura 16 - Gráfico de 50 observações em duas variáveis (JOLLIFE, 2002)

É possível observar que, apesar de existir variância considerável nas duas

variáveis, ela é maior na direção do eixo de L3. Assim, ao realizar a ACP considerando

dois componentes principais w1, w3, obtém-se o gráfico da Figura 19.

Page 53: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

44

Figura 17 - 50 observações com relação aos seus componentes principais (JOLLIFFE,

2002)

Fica claro, portanto, que a componente principal w1 retém a maior parte da

variância original, enquanto que na direção de w3 a variância é bem pequena. Para casos

gerais em que X > 2 e as variáveis sejam correlacionadas, é esperado que a maior parte

da variância esteja acumulada nos primeiros eixos principais e os últimos sejam menos

representativos (JOLLIFFE, 2002).

Nesse sentido, o objetivo da ACP é rotacionar rigidamente os eixos de um espaço

p-dimensional, associado às variáveis W1, W3, W4,⋯ ,W[, para novas posições (eixos

principais), associadas aos componentes principais (JOLLIFFE, 2002).

Além de serem ordenados de acordo com a variância, outra propriedade dos

componentes principais é que a covariância entre eles é zero, o que, graficamente, é

representado pela ortogonalidade entre cada par de eixos principais (JOLLIFFE, 2002).

4.3.4 Matriz de covariância e matriz de correlação

Os componentes principais buscam, de forma sucessiva, maximizar a variância da

base de dados original e podem ser achados através dos autovalores e autovetores da

Page 54: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

45 matriz de covariância ^. Todavia, algumas modificações na técnica são adotadas para

evitar, principalmente, dois problemas recorrentes que dificultam a interpretação dos

componentes principais: mistura de unidades de medida e diferença de escalas

(JOLLIFFE, 2002).

Muitas vezes as variáveis de um problema possuem diferentes unidades de

medida, o que torna incoerente a determinação de uma combinação linear entre elas. É o

caso em que se avaliam, por exemplo, dados de altura, temperatura e peso de um

indivíduo. Jolliffe (2002) também aponta para os diferentes componentes principais que

podem ser obtidos ao se optar pela escala Celsius ao invés da Farenheit na medição de

temperaturas, já que são escalas intervalares e a variação entre as medidas é diferente.

Outra situação que pode prejudicar a interpretação dos dados é quando as variáveis

apresentam a mesma unidade de medida, porém algumas delas possuem variâncias muito

maiores que as outras. Nesses casos, os primeiros componentes principais são

completamente dominados pelas variáveis com variância elevada, podendo levar a

resultados que não caracterizem com precisão as informações da base original

(JOLLIFFE, 2002).

Para contornar essas arbitrariedades, as variáveis devem ser normalizadas para

que apresentem variações unitárias. Ao buscar-se combinações lineares de variáveis

normalizadas, os componentes principais passam a ser definidos pelos autovalores e

autovetores da matriz de correlação _ e não mais da matriz de covariância ^ (JOLLIFFE,

2002).

Segundo Souza (1995), a aplicação da ACP a partir de uma matriz de covariâncias

^ é aconselhável apenas nos casos em que os dados apresentam uma mesma unidade de

medida e dimensão não muito discrepante. Nas demais situações, é recomendada a

normalização dos dados.

Saha (2018) em seus estudos compara a aplicação da ACP em três cenários

diferentes:

1. Matriz de covariância em dados normalizados

2. Matriz de correlação em dados normalizados

3. Matriz de correlação em dados não-normalizados

Em todos os casos, os autovalores e autovetores extraídos da análise, assim como

a contribuição dos primeiros componentes principais, apresentaram os mesmos valores,

podendo-se concluir que normalizar os dados com posterior aplicação da ACP a partir da

Page 55: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

46 matriz de covariância leva ao mesmo resultado que a aplicação da ACP pela matriz de

correlação.

4.3.5 Quantos componentes principais escolher?

O cerne do método da ACP está na redução dimensional de X variáveis para x

componentes principais, sendo x < X. Em seu livro, Jolliffe (2002) apresenta diversos

procedimentos da literatura para a escolha desse número mínimo de componentes que

retém informação suficiente para sustentar uma análise de dados relevante. Todavia, a

conclusão que se chega é que diferentes objetivos na aplicação da ACP levam a diferentes

necessidades com relação aos números de componentes principais que devem ser retidos

na análise. Apesar disso, dois critérios relativamente simples e que funcionam bem em

muitos casos são descritos nos próximos itens.

4.3.5.1 Porcentagem acumulada do total de variância

Este é possivelmente o critério mais intuitivo para definição do valor de x e

consiste, basicamente, em estabelecer um limite mínimo z∗, como 80% ou 90%, acima

do qual deve estar o total de variância acumulada dos componentes principais

selecionados (z|). A quantidade de componente é, portanto, o menor valor de x para o

qual o limite z∗ previamente definido é superado ( z| > z∗). No caso da ACP a partir da

matriz de correlação, tem-se que:

z|Q100X vf?

|

?Q1

(2.4)

Sendo,

X = total de variância (no caso da matriz de correlação)

f? = variância do componente principal @

Segundo Jolliffe (2002), apesar da linha de corte ser normalmente entre 70% e 90%,

não há uma forma exata de definir o valor de z∗, ele pode ser maior ou menor dependendo

do detalhamento da base dados e do nível de correlação entre as variáveis. Além disso, é

esperado um valor de z∗ menor a medida que X, ou seja, o total de variância, aumenta ou

que o número de observações " seja maior.

Page 56: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

47 4.3.5.2 Valor da variância dos componentes principais

Este critério é usado exclusivamente em análises a partir das matrizes de

correlação, mas pode ser adaptado para as matrizes de covariância também. Parte-se do

princípio de que se todas as variáveis W1, W3, W4,⋯ , W[ fossem completamente

independentes umas das outras e não-correlacionadas, então todos os componentes

principais teriam variância unitária e seriam equivalentes às variáveis originais.

A partir desse pressuposto, os componentes principais que tenham variância f <

1 são entendidos como aqueles que contêm menos informação do que uma das variáveis

originais e, por isso, devem ser descartados. Essa regra, na sua forma mais simples, é

conhecida como Regra de Kaiser, que considera apenas os componentes principais com

variância maior que 1 (JOLLIFFE, 2002).

Por outro lado, Jolliffe (2002) diz que este critério simples de eliminação pode

prejudicar a análise nos casos em que se tem, por exemplo, um grupo de variáveis

fortemente correlacionadas junto com uma variável que seja, de certa forma,

independente das outras. Nesse caso, apesar de ser retido um componente principal com

f > 1, que representa bem o grupo de variáveis correlacionadas, o fato de ter uma

variável independente não apareceria na análise dos resultados.

Para tanto, baseado em estudos anteriores, Jolliffe (2002) sugere que a Regra de

Kaiser seja adaptada tomando como critério de descarte dos componentes principais a

relação f? < 0,7 a fim de obter resultados mais assertivos.

ANÁLISE FATORIAL

Figueiredo Filho e Silva Junior (2010) definem a análise fatorial como um

conjunto de técnicas multivariadas com objetivo de encontrar uma estrutura subjacente

em uma matriz de dados e determinar um novo grupo de variáveis latentes (fatores) que

melhor representam o conjunto de variáveis observadas.

Page 57: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

48

Figura 18 - Representação da análise fatorial

Ainda, a Análise Fatorial (AF) pode ser caracterizada sob uma ótica exploratória

ou confirmatória. Quando as variáveis são encaixadas em um grupo de acordo com sua

correlação, a análise é exploratória, e quando já se tem uma suspeita de composição dos

fatores e apenas busca-se uma confirmação, ela é confirmatória (CARVALHO, 2017).

A AF prevê que as variáveis observáveis L1, L3,⋯ , L6 geram xvariáveis não-

observáveis M1, M3,⋯ , M|. O método assume, ainda, que as variáveis são combinações

lineares dos fatores somado a um termo de erro. Dessa forma, para Z = 1,2…",

LY = v$Y�M� + ÄY|

1

(2.5)

ou em formato de matriz de resultados,

Å = ÇÉ + Ñ (2.6)

As soluções para as cargas $Y� que maximizam a variância da base de dados, ou

seja, a quantidade de informação retida, não são únicas. Em particular, caso a matriz de

cargas Ç seja multiplicada por uma matriz ortogonal Ö, o resultado obtido será tão

representativo quanto o original, porém com eixos rotacionados, o que pode simplificar a

estrutura do problema. A ideia da rotação é, portanto, buscar dentre as melhores soluções,

aquela que pode ser mais facilmente interpretada, ou seja, que possibilite ver claramente

quais fatores influenciam cada variável e quais não (JOLLIFFE e MORGAN, 1992).

A análise fatorial é geralmente aplicada quando: 1) não há evidências suficientes

que explicitem como os itens de determinado instrumento devem ser agrupados e

avaliados; ou 2) quando o pesquisador quer confirmar ou refutar a estrutura fatorial de

Page 58: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

49 determinado instrumento (BROWN, 2006). Durante a realização de uma análise

exploratória, o pesquisador precisa tomar diversas decisões a fim de se obter uma

estrutura fatorial adequada e, portanto, essa técnica possui alto potencial de produzir

resultados pouco assertivo e confiáveis (DAMASIO, 2012)

COMPARAÇÃO ENTRE MÉTODOS

A Análise de Componentes Principais (ACP) e a Análise Fatorial (AF) são

ferramentas muito importantes nas análises multivariadas. Como apontado anteriormente,

é recorrente encontrar na literatura a ACP sendo descrita como um caso especial da AF

ou sendo considerada uma opção de ferramenta dentro de bibliotecas de programação

para análise fatorial. Apesar disso, elas são técnicas distintas (JOLLIFFE, 2002).

Tanto a ACP quando a AF tem como objetivo a redução dimensional de uma base

dados contendo um número grande de variáveis (") em um novo conjunto menor de

variáveis (x)com menor perda de informação possível, mas a forma de executá-la é

diferente em cada método.

Damasio (2012) aponta que a diferença entre as AFs e as ACPs resta sobre a forma

como os itens são retidos. Segundo ele, em ambos os métodos a redução dimensional

assume que a variância possui 3 componentes: variância específica, variância comum e

variância de erro. A primeira refere-se a parcela da variância do item que não é

compartilhada com as demais variáveis. A variância comum está ligada a parcela da

variância que é compartilhada entre todos os itens que integram determinado fator ou

componente. Por fim, a variância de erro refere-se a parcela do item não explicada pelo

fator ou componente.

Na ACP, os índices resultantes das análises de determinado componente incluem

tanto a variância comum como a específica. Já na AF, apenas a variância comum é

considerada. Como as análises fatoriais buscam revelar construtos latentes que explicam

a covariância dos itens, as variâncias específicas não são consideradas (DAMASIO,

2012).

A comparação dos resultados obtidos da aplicação das duas análises revela que na

ACP as variáveis tendem a apresentar cargas fatoriais e comunalidades mais elevadas

assim como taxas de variância explicada infladas em relação a AF. Isso ocorre justamente

porque a variância específica de cada item é considerada. Esses resultados, todavia,

Page 59: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

50 podem ser imprecisos quando busca-se compreender um construto latente que gera a

covariância entre os itens (DAMASIO, 2012).

Jolliffe e Morgan (1992) comparam os resultados obtidos em diversas análises

usando os dois métodos e apontam 3 diferenças entre as ACP e AF:

1. Na AF, ao alterarmos o número de fatores analisados de x para (x + 1),

a natureza dos fatores é modificada e a variância total redistribuída. Já na

ACP, a mesma alteração apenas fornece um componente extra, sem alterar

o total de variância explicada pelos anteriores.

2. Enquanto na ACP os componentes principais são combinações lineares

das variáveis Ls, na AF as variáveis é que são combinações lineares dos

fatores, mais um termo de erro. Ao menos que os dados sejam extraídos

de uma análise multivariada normalizada, não se pode garantir que os

fatores possam ser representados como funções lineares das variáveis.

3. Salvo em situações particulares, não é possível calcular de forma análoga

os fatores resultantes na AF e os componentes principais na ACP. Uma

vez estimados, os fatores podem ser manipulados segundo os mesmos

critérios dos componentes principais, mas a AF é normalmente mais usada

na interpretação das informações ligadas a correlação entre os itens, e não

nas análises subsequentes e específicas a partir dos resultados.

Entendendo que o objetivo do trabalho não é identificar um constructo latente

entre as variáveis e sim avaliar as cargas individuais de cada uma dentro de cada

componente, optou-se pelo uso da análise de componentes principais. Além disso, com

base nos estudos anteriores, a aplicação da ACP se mostrou satisfatória na redução

dimensional e simplificação de estruturas de dados ligados ao comportamento de

usuários, o que fortaleceu a escolha.

Page 60: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

51 5 MÉTODO E APLICAÇÃO

BANCO DE DADOS

Através do uso de algoritmos e sensores de vibração nos aparelhos de celular, o

aplicativo BIKLIO reconhece quando o usuário está se locomovendo por bicicleta. Todos

esses deslocamentos, identificados pelo aplicativo como sendo realizados por meio da

bicicleta, são armazenados em uma base de dados. Os registros contêm as informações

de data e horário de início e término de cada viagem e estão associados ao número de

identificação do usuário no sistema.

A Figura 21 mostra parte do registro de viagens de um usuário arbitrário >. Os

dados são extraídos com extensão .json e o armazenamento das informações é estruturado

de forma que:

• “userId”: indica o número de identificação do usuário

• “start”: indica o início de uma viagem

• “end”: indica o término de uma viagem

• “$date”: indica a data/horário de cada início e término de viagem, com

precisão de milésimos de segundo

Figura 19 - Estrutura de registros de viagens

Para o desenvolvimento deste trabalho, foi disponibilizada a base de dados de

todos os usuários da cidade de Lisboa, desde o lançamento do aplicativo até o mês de

fevereiro de 2020. No total, foram analisados os registros de 454 usuários diferentes.

Tanto para o processo de tratamento dos dados da base como para a própria aplicação da

Page 61: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

52 Análise de Componentes Principais foi utilizado o software da plataforma de

desenvolvimento integrado Spyder, com código aberto para programação científica em

linguagem Python.

5.1.1 Tratamento dos dados

Muitos fatores podem levar ao armazenamento dos dados com erros ou baixa

representatividade, como o desligamento do gps, esgotamento da bateria do aparelho

celular durante um trajeto ou simplesmente um erro no algoritmo.

Ademais, como pode ser observado na amostra de registros da Figura 21, o tempo

de cada viagem é, normalmente, muito curto, com variações de segundos ou poucos

minutos. Isso acontece porque não há uma precisão tão alta dos sensores do aparelho e

porque a cada vez que o ciclista realiza uma parada momentânea, seja por causa de um

sinal de trânsito ou para ajustar o capacete, a viagem é encerrada. Tomando como

exemplo uma viagem de 20 minutos, em que o ciclista sai do ponto A até o ponto B, as

eventuais paradas que o usuário realiza ao longo do percurso e as variações de velocidade

e vibração captadas pelo aparelho celular fazem com que as viagens sejam fracionadas

em registros mais curtos, que juntos representam o trajeto completo. Portanto, é

indispensável que seja realizado um tratamento dos dados para melhor interpretação dos

resultados.

Para os 454 usuários analisados, obteve-se um total de 908.525 registros de

viagens, sabendo-se que, como dito anteriormente, essas viagens não configuram um

trajeto total do indivíduo desde a origem até o destino final. Por outro lado, pelo Gráfico

5.1, em que os usuários estão ordenados de acordo com o total de registros de viagens de

cada um, observou-se que a maior parte desses registros está concentrada na atividade de

poucos usuários. Considerando as 30 pessoas que mais utilizam o aplicativo, é possível

obter 97% do total de registros da base.

Para o tratamento em si, foram desconsideradas viagens com ano de registro de

1970, tipicamente associadas às situações em que o sistema é reiniciado ou desligado

durante um percurso de bicicleta. Observou-se a ocorrência deste erro em 103.577

registros, ou seja, 11,4% da base total. Como não havia nenhuma referência que

permitisse a estimação da data e horário mais precisos de realização dessas viagens,

assumiu-se que, como a falha ocorria ao acaso, a exclusão dessas viagens da análise não

Page 62: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

53 comprometeria o resultado final. Além disso, os horários de início e fim de cada viagem

foram simplificados de forma a serem representados com precisão apenas de minutos.

Gráfico 5.1 – Total de registros por usuário

Outro tratamento realizado foi a individualização de cada trajeto completo de

bicicleta, já que as viagens separadas não representam o percurso inteiro do usuário do

ponto de partida até o seu destino final, e sim parte dele. Dessa forma, foi preciso definir

um intervalo máximo que podia existir entre o final de uma viagem e o início da seguinte

para que as duas fossem consideradas como pertencentes a um mesmo trajeto. Para tanto,

foram realizadas simulações variando-se os intervalos máximos e observando-se o

tamanho da base remanescente. Pelo Gráfico 5.2, é possível perceber que, a partir de 7

minutos de intervalo, a curva fica menos angulada, ou seja, há uma variação menor no

tamanho da base. Assumiu-se, portanto, que registros com intervalo menor que 7 minutos

comporiam uma mesma viagem.

Gráfico 5.2 – Tamanho da base com variação dos intervalos máximos

Page 63: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

54 Posteriormente, os dados foram organizados em uma nova base, na qual as viagens

são listadas e dividas em 3 campos: (i) data de início da viagem (start), (ii) data de fim

da viagem (end), (iii) tempo total de viagem (etime). O tamanho da nova base, após o

processo anterior, reduziu para 558.115 registros e vale ressaltar que cada um deles está

associado a um trajeto específico. A Figura 22 mostra parte dessa base referente às

viagens do mesmo usuário >.

Figura 20 - Base tratada com individualização das viagens

Apesar do tratamento realizado para agrupar os registros e individualizar os trajetos,

nota-se, ainda assim, que muitas viagens contêm tempos de duração curtos, entre 0 e 2

minutos, provavelmente fruto de alguma falha do algoritmo do aplicativo. Assumindo

que a distância mínima percorrida em um trajeto de bicicleta seja de 1,0 km e que a

velocidade média da bicicleta no centro urbano é de 20 km/h (CRUZ, 2015), então os

registros com intervalo de duração menor que 3 minutos foram desconsideradas da

análise. Dessa forma, 8.271 viagens foram retiradas da base.

Outro ponto relevante é que, durante a tratamento dos dados, observou-se que

muitos registros haviam sido armazenados de forma duplicada, principalmente em

registros dos anos de 2019 e 2020. Deduziu-se que esse problema havia sido consequência

de alguma atualização recente do servidor e, para que não houvesse interferência nos

resultados, a base foi tratada retirando-se todos os elementos repetidos. Então, foi definida

uma nova base a partir da qual o modelo foi proposto. Esta base final ficou com 14.071

registros.

Page 64: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

55 MODELO PROPOSTO

Como é previsto no método de análise por componentes principais, o ponto de

partida para a modelagem do problema foi a definição da estrutura matricial com X

variáveis independentes e " observações distintas.

Optou-se, então, por representar os dados da base de viagens através da matriz de

elementos binários Ü(" × 24) (3.0)

Ü = B

x11 x13 ⋯ x13àx31 x33 ⋯ x33à⋮ ⋮ ⋱ ⋮

x61 x63 ⋯ x63à

D (3.0)

Onde:

Cada colunaZ corresponde a uma hora diária

" = total de dias em que houve, ao menos, uma viagem de bicicleta

x?Y = 1, se o usuário iniciou alguma viagem de bicicleta na hora Z do dia @

x?Y = 0, se o usuário não iniciou nenhuma viagem de bicicleta na hora Z do dia @

Vale ressaltar, ainda, que as linhas da matriz, além de corresponderem aos dias

em que houve, pelo menos, um registro de viagem de bicicleta, também são caracterizadas

por um número de identificação do usuário. Assim, mesmo que duas pessoas utilizem o

aplicativo no mesmo dia, as viagens de cada usuário serão registradas em linhas

diferentes, preservando as particularidades das rotinas de cada indivíduo.

5.2.1 Análise de componentes principais no modelo proposto

Ao aplicar a análise de componentes principais no modelo proposto, busca-se,

principalmente, olhar para dois parâmetros: o peso de cada variável independente nos

componentes principais e a quantidade de informação retida por cada um deles.

Nesta análise, especificamente, os componentes principais são vetores ortogonais

de dimensões (1 × 24) que representam o comportamento de viagens de um indivíduo

ou de um grupo. Como as viagens normalmente estão associadas à uma rotina, é esperado

que exista uma repetição das atividades e uma correlação entre as horas do dia (variáveis

independentes do problema), ou seja, se o usuário usa a bicicleta para ir ao trabalho ou a

Page 65: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

56 um curso, é provável que, nesses dias, seja observado um padrão de comportamento que

envolve a realização de viagens na parte da manhã e outras na parte da tarde.

Para se interpretar adequadamente e dar nome aos componentes, é importante

analisar, também, os valores das cargas fatoriais das variáveis. Em outras palavras, deve

ser analisada a contribuição (negativa ou positiva) das variáveis (horas do dia) em relação

a cada um dos 24 componentes. Quanto maior a contribuição positiva de uma variável,

maior será sua representatividade e importância para o componente.

Cada componente principal está associado a um valor escalar. Eles são,

respectivamente, os autovetores e autovalores da matriz de covariância obtida a partir das

variáveis da matriz Ü. Os autovalores representam a variância de cada componente e são

extraídos em ordem decrescente, de forma que o primeiro componente principal (PC1) é

o que retém maior quantidade de informação da base e o componente PC24 é o menos

representativo. Para esta análise, foram consideradas as porcentagens acumuladas do total

de variância de acordo com o número de componentes escolhidos.

RESULTADOS OBTIDOS NA MODELAGEM E ANÁLISES

A aplicação da análise de componentes principais se deu em duas etapas. Primeiro,

o método foi aplicado a uma base de dados contendo registros de viagens apenas do

usuário I, escolhido por ser um dos usuários com maior frequência de utilização do

aplicativo. Em seguida, realizou-se a mesma análise tomando como base os registros de

todos os usuários da cidade de Lisboa. Dessa forma, foi possível identificar as

particularidades dos resultados em cada um dos casos e traçar um comparativo entre a

relevância da aplicação do método em uma análise individual e em grupo.

5.3.1 Indivíduo

Assim como no caso da cidade de Lisboa, a base de dados do indivíduo I também

foi tratada e estruturada usando as mesmas premissas anteriores. Ao final do tratamento

a base final continha 133 registros de viagens individualizadas.

Page 66: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

57 5.3.1.1 Componentes principais

A tabela 1 apresenta todos os componentes extraídos da análise do banco de dados

do usuário I. Para facilitar a interpretação dos resultados, foram destacadas em cada linha

as variáveis que possuem maiores cargas fatoriais e que, portanto, caracterizam melhor

os respectivos componentes.

Sendo assim, algumas constatações podem ser feitas:

• O componente PC1 representa o padrão de deslocamento diário mais

significativo do usuário I. Ele é caracterizado, principalmente, por viagens realizadas às

15:00. Há, também, uma pequena carga fatorial às 9:00 que indica a tendência de fluxo

pendular do componente, apesar do horário em é realizado o deslocamento casa-

trabalho/casa-estudo variar mais do que na viagem de retorno.

• Os componentes PC2 e PC3 descrevem outras variações das viagens pendulares

realizadas pelo usuário I. O primeiro é caraterizado por viagens realizadas por volta de

8:00 e de 17:00. Já o segundo, além de evidenciar tendência de viagens pela parte da

manhã e do final da tarde, também apresenta uma carga fatorial elevada perto de 13:00,

o que pode representar um comportamento de deslocamentos realizados durante o horário

de almoço do usuário, por exemplo.

• O componente PC4 também representa uma viagem pendular, mas,

diferentemente dos componentes anteriores, a viagem residência-trabalho/residência-

estudo se dá um pouco mais tarde, por volta das 11:00.

• Os componentes PC5, PC6 e PC7 representam rotinas de meio período,

possivelmente caracterizando uma volta antecipada para casa, por exemplo.

• As rotinas representadas pelos PC 8 e PC 9 e PC11 são caracterizadas por

viagens na parte de manhã e outras a noite, por volta 21:00. Nesses dias, é possível

identificar uma extensão do horário de trabalho ou estudo ou, ainda, a realização de

atividades noturnas, por exemplo.

• O PC10 e PC13 representam rotinas diárias que se iniciam por volta de 8:00 e

terminam entre 13:00 e 14:00.

• O PC12 contem cargas fatoriais elevadas nos horários de 7:00 e 10:00 e pode

estar associado a um dia de final de semana do usuário em que realiza alguma atividade

de lazer diurna.

Page 67: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

58

Tabela 1 – Matriz de componentes - Aplicação da ACP na base de dados do usuário I

Componente

00:00

01:00

02:00

03:00

04:00

05:00

06:00

07:00

08:00

09:00

10:00

11:00

12:00

13:00

14:00

15:00

16:00

17:00

18:00

19:00

20:00

21:00

22:00

23:00

PC1 0.00 -0.01 -0.01 0.00 0.00 0.00 0.00 -0.02 -0.16 0.14 -0.07 -0.14 -0.27 0.11 0.08 0.87 0.22 0.16 -0.03 0.02 0.02 -0.01 -0.03 -0.04

PC2 -0.02 0.00 0.03 0.00 0.00 0.00 0.00 -0.03 0.20 -0.22 -0.12 -0.46 0.15 -0.17 -0.08 0.00 -0.27 0.73 -0.08 0.01 0.03 0.08 0.00 0.00

PC3 0.06 -0.01 0.03 0.00 0.00 0.00 0.00 -0.01 0.03 0.24 -0.07 0.02 0.02 0.50 -0.11 -0.26 0.49 0.40 0.44 0.03 -0.03 -0.03 -0.04 -0.01

PC4 -0.03 0.00 0.01 0.00 0.00 0.00 0.00 0.07 -0.09 0.18 0.19 0.57 -0.47 -0.33 0.08 -0.13 -0.04 0.47 -0.13 -0.01 0.07 0.01 -0.01 0.05

PC5 -0.02 -0.01 -0.02 0.00 0.00 0.00 0.00 -0.01 -0.09 0.14 0.28 0.29 0.42 0.55 0.17 0.14 -0.42 0.18 -0.25 0.00 -0.03 -0.05 -0.05 -0.03

PC6 -0.03 -0.01 -0.01 0.00 0.00 0.00 0.00 -0.01 -0.02 0.63 0.12 -0.01 0.48 -0.41 -0.37 0.10 0.14 0.00 -0.06 0.00 0.03 0.09 -0.02 -0.03

PC7 0.00 -0.01 -0.02 0.00 0.00 0.00 0.00 -0.31 -0.14 0.03 0.01 -0.09 0.26 -0.22 0.77 -0.12 0.34 0.08 -0.10 -0.06 -0.10 0.03 -0.02 -0.05

PC8 -0.01 0.01 0.00 0.00 0.00 0.00 0.00 0.22 0.02 0.52 0.11 -0.44 -0.33 0.13 0.28 -0.18 -0.30 -0.11 0.05 0.06 0.01 0.36 0.02 -0.01

PC9 -0.01 0.00 -0.06 0.00 0.00 0.00 0.00 0.50 -0.09 -0.14 -0.16 0.02 0.04 0.12 -0.09 -0.09 0.33 0.04 -0.53 -0.12 -0.28 0.39 -0.01 -0.15

PC10 -0.02 -0.01 0.07 0.00 0.00 0.00 0.00 0.21 0.72 0.21 -0.37 0.20 0.03 -0.05 0.24 0.12 -0.06 -0.04 0.01 -0.04 -0.20 -0.25 -0.05 -0.16

PC11 0.01 -0.02 0.05 0.00 0.00 0.00 0.00 -0.42 0.45 -0.14 0.28 0.16 -0.05 0.05 -0.07 0.13 0.07 -0.06 0.07 -0.07 -0.09 0.66 -0.06 -0.02

PC12 0.02 -0.01 0.03 0.00 0.00 0.00 0.00 0.41 0.25 -0.17 0.75 -0.20 0.03 -0.07 0.08 0.06 0.22 0.00 0.08 -0.08 -0.01 -0.25 -0.06 0.05

PC13 -0.02 0.03 -0.05 0.00 0.00 0.00 0.00 -0.43 0.22 0.17 0.12 -0.21 -0.26 0.18 -0.19 -0.16 0.16 -0.03 -0.59 0.01 0.01 -0.34 0.14 -0.04

PC14 -0.01 -0.03 -0.03 0.00 0.00 0.00 0.00 0.13 0.19 -0.04 -0.11 0.05 0.09 0.08 0.12 -0.01 0.17 -0.04 -0.18 0.17 0.87 0.13 -0.15 0.13

PC15 -0.02 -0.01 -0.02 0.00 0.00 0.00 0.00 0.00 0.05 0.08 -0.11 -0.02 0.01 0.04 0.02 0.03 0.01 -0.01 -0.08 -0.31 -0.15 0.00 -0.14 0.91

PC16 0.01 -0.05 0.03 0.00 0.00 0.00 0.00 0.06 0.04 0.02 -0.01 0.05 0.06 0.03 0.05 0.05 0.01 0.03 0.07 -0.44 0.20 0.06 0.86 0.01

PC17 -0.04 -0.06 -0.02 0.00 0.00 0.00 0.00 0.07 0.08 -0.04 0.03 0.06 0.07 -0.02 0.05 0.05 0.08 0.01 -0.03 0.81 -0.20 0.06 0.42 0.30

PC18 -0.09 0.99 0.09 0.00 0.00 0.00 0.00 0.02 0.01 0.00 0.01 0.02 0.03 0.01 0.02 0.02 0.02 0.01 0.01 0.02 0.02 0.02 0.06 0.03

PC19 0.88 0.12 -0.44 0.00 0.00 0.00 0.00 0.01 0.05 0.02 0.00 0.02 0.01 -0.04 0.01 0.02 -0.04 0.02 -0.01 0.02 -0.01 0.00 0.02 0.01

PC20 0.45 -0.04 0.88 0.00 0.00 0.00 0.00 0.00 -0.07 0.02 -0.01 0.00 0.01 0.00 0.00 0.00 0.01 -0.02 -0.12 0.04 0.01 0.00 -0.01 0.04

PC21 0.00 0.00 0.00 -0.05 0.94 -0.22 0.27 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00

PC22 0.00 0.00 0.00 -0.95 -0.06 -0.23 -0.18 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00

PC23 0.00 0.00 0.00 0.25 0.18 -0.36 -0.88 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00

PC24 0.00 0.00 0.00 0.17 -0.29 -0.88 0.35 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00

Page 68: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

59 • Do PC14 ao PC24, nota-se que o comportamento do usuário deixa de ser

representado por viagens pendulares e rotineiras e passa a ser caracterizado por viagens

pontuais, em horários alternativos e pouco representativas. Nesses casos, é possível

perceber que, no geral, uma variável possui uma carga muito maior do que as outras, o

que significa que esta não está tão correlacionada com as demais. Os componentes com

essas características, não surpreendente, são aqueles que retêm menor quantidade de

informação da base, já que as viagens são esporádicas, não fazem parte de uma rotina do

usuário e, portanto, representam pouco da variância dos dados.

5.3.1.2 Variância

A partir da tabela 2, é possível identificar a participação de cada componente na

variância total dos dados, assim como a variância total acumulada, a medida em que são

considerados mais componentes na análise.

Tabela 2 - Variância por componente e acumulada - ACP aplicada a base de dados do

usuário I

Número de componentes

Variância por componente

Variância acumulada

1 13.41% 13.41% 2 11.94% 25.34% 3 10.34% 35.69% 4 9.81% 45.50% 5 8.45% 53.94% 6 6.76% 60.70% 7 6.16% 66.86% 8 5.99% 72.85% 9 4.84% 77.69%

10 4.27% 81.96% 11 3.90% 85.86% 12 3.73% 89.59% 13 2.88% 92.47% 14 2.37% 94.85% 15 1.61% 96.46% 16 1.24% 97.69% 17 1.10% 98.79% 18 0.44% 99.24% 19 0.41% 99.64% 20 0.36% 100.00% 21 0.00% 100.00% 22 0.00% 100.00% 23 0.00% 100.00% 24 0.00% 100.00%

Page 69: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

60 Como prevê o método, os primeiros componentes são aqueles que carregam a

maior quantidade de informação da base de dados e, com apenas 10 componentes

principais, é possível explicar o comportamento do usuário I com mais de 80% de

precisão. Fato é que, como as variáveis (horas do dia) estão correlacionadas e as viagens

fazem parte de uma rotina de deslocamento que se repete ao longo do uso do aplicativo,

é compreensível que os primeiros componentes principais realmente retenham uma maior

variância das informações e representem os padrões de viagens mais comuns, ou seja, os

deslocamentos casa-trabalho/casa-estudo.

Já as contribuições dos componentes PC11 ao PC24 são consideravelmente mais

baixas do que os primeiros. Como visto no item anterior, eles representam viagens

realizadas em horários alternativos e, como pode ser observada pela variância associada

a esses componentes, essas viagens estão fora da rotina do usuário. São deslocamentos

realizados com frequência muito baixa e que pouco caracterizam o comportamento

padrão do indivíduo.

5.3.2 Cidade de Lisboa

5.3.2.1 Componentes principais

A tabela 3 apresenta os componentes extraídos da ACP aplicada ao banco de

dados contendo registros de todos os usuários do aplicativo BIKLIO na cidade de Lisboa.

Novamente, para facilitar a interpretação dos resultados, foram destacadas em cada linha

as variáveis que possuem maiores cargas fatoriais e que, portanto, caracterizam melhor

os respectivos componentes.

Sendo assim, algumas constatações podem ser feitas:

• O PC1 representa um padrão de viagem pendular, em que há um deslocamento

pela parte da manhã, cerca de 8:00, e outro na final da tarde, por volta de 18:00. O motivo

dessa viagem é, provavelmente, casa-trabalho/casa-estudo.

• O PC2 indica cargas fatoriais elevadas nos horários de 16:00 e 17:00 e uma carga

menor às 8:00. Esse componente pode estar associado a uma rotina pendular em que se

privilegia o uso de bicicleta, principalmente, no retorno para a residência.

• O PC3 também pode estar associado a dinâmica de viagem por motivo de

trabalho/estudo e apresenta cargas mais elevadas nos horários de 9:00 e 17:00.

Page 70: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

61 • O PC4 apresenta cargas altas nos horários entre 13:00 e 16:00 e, também, às

16:00. Pode estar associado a deslocamentos para lazer, cursos, etc...

• PC5 e PC6 são caracterizados por viagens pendulares com retornos mais cedo e

mais tarde, respectivamente.

• PC7 apresenta cargas mais elevadas por volta do 12:00 e pode estar associado

ao uso da bicicleta em horário de almoço.

• O PC8 possui cargas fatoriais elevadas apenas por volta de 10:00. Esse padrão

pode estar associado, por exemplo, aos deslocamentos que são feitos por bicicleta quando

a origem é a casa, mas que na viagem de retorno é escolhido outro modo de transporte.

• Do PC9 ao PC12, nota-se que as cargas positivas estão distribuídas entre horários

de manhã, tarde e noite. Esses padrões podem estar associados aos dias de lazer e finais

de semana, por exemplo.

• O PC13 e PC14 estão associadas às rotinas de meio período, em que há uma

viagem por volta de 7:00 e outra entre 11:00 e 12:00.

• Do PC15 ao PC24, pode-se observar que o comportamento do grupo, assim

como o do usuário, deixa de ser representado por viagens pendulares e rotineiras e passa

a ser caracterizado por viagens pontuais, em horários alternativos e pouco representativas.

Dessa forma, esses componentes são, praticamente, associados à uma única variável e

retêm uma baixa parcela da variância dos dados.

Page 71: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

62

Tabela 3 – Matriz de componentes - Aplicação da ACP na base de dados da cidade de Lisboa

Componente

00:00

01:00

02:00

03:00

04:00

05:00

06:00

07:00

08:00

09:00

10:00

11:00

12:00

13:00

14:00

15:00

16:00

17:00

18:00

19:00

20:00

21:00

22:00

23:00

PC1 -0.02 -0.01 -0.01 -0.01 -0.01 -0.02 -0.02 0.02 0.43 0.18 -0.11 -0.07 -0.08 -0.05 -0.05 -0.10 -0.06 0.17 0.83 0.12 -0.02 0.00 -0.01 -0.02

PC2 -0.01 -0.01 0.00 0.00 0.01 0.02 0.02 0.09 0.13 -0.34 -0.17 -0.05 -0.02 0.03 -0.01 0.11 0.38 0.74 -0.08 -0.31 -0.09 -0.02 -0.01 -0.02

PC3 -0.01 -0.01 -0.01 -0.01 -0.01 -0.02 -0.03 -0.03 0.24 0.71 0.20 0.07 0.11 0.13 0.14 0.08 0.00 0.40 -0.33 0.26 0.04 -0.03 0.01 -0.01

PC4 0.00 0.00 -0.01 -0.01 0.00 0.00 0.00 -0.09 -0.54 0.10 0.13 0.12 0.16 0.31 0.39 0.30 0.34 0.02 0.40 0.00 0.08 0.03 0.03 0.01

PC5 -0.01 0.00 0.00 0.00 0.00 0.00 0.00 0.02 0.48 0.16 0.09 0.12 0.12 0.22 0.07 0.10 0.30 -0.43 -0.03 -0.60 -0.08 -0.05 -0.04 -0.03

PC6 -0.01 0.00 -0.01 -0.01 0.00 -0.01 -0.01 0.06 0.40 -0.44 0.04 0.04 0.18 0.24 0.17 0.11 0.27 -0.17 -0.08 0.63 0.02 0.01 0.01 0.00

PC7 0.00 0.00 0.00 0.00 -0.01 -0.03 -0.04 -0.01 0.07 -0.27 0.21 0.22 0.36 0.39 0.14 -0.07 -0.66 0.20 0.06 -0.19 -0.05 0.00 0.00 0.01

PC8 -0.01 0.01 0.00 0.00 0.00 0.00 -0.01 -0.07 0.10 -0.18 0.81 0.13 -0.19 -0.45 0.09 0.08 0.06 0.07 0.08 -0.05 0.10 0.02 -0.01 0.01

PC9 -0.01 -0.01 0.00 0.00 0.00 0.00 -0.01 -0.07 0.17 -0.05 -0.21 -0.27 -0.40 -0.03 0.45 0.56 -0.33 -0.04 -0.07 -0.08 0.22 0.05 0.04 0.01

PC10 0.01 0.00 0.00 0.00 -0.01 -0.01 -0.02 -0.29 0.06 -0.05 0.02 -0.21 -0.12 0.21 0.19 -0.58 0.13 0.04 -0.05 -0.10 0.62 0.12 0.08 0.02

PC11 -0.01 0.00 0.00 0.00 0.00 0.00 -0.01 -0.02 0.06 0.01 -0.30 0.19 0.59 -0.60 0.30 -0.01 0.00 0.00 0.00 -0.06 0.25 0.07 0.05 0.00

PC12 0.01 0.00 0.00 -0.01 0.00 -0.01 0.00 -0.15 0.03 -0.01 -0.02 0.21 0.10 0.10 -0.64 0.43 -0.02 0.02 0.04 0.00 0.55 0.09 0.04 0.02

PC13 -0.01 -0.01 -0.01 -0.01 -0.01 -0.01 -0.01 0.76 -0.07 0.05 0.20 -0.47 0.22 0.03 -0.04 0.03 -0.02 -0.03 0.04 -0.05 0.29 -0.06 -0.04 0.00

PC14 -0.01 -0.01 -0.01 0.00 0.00 0.00 -0.01 0.52 -0.02 0.02 -0.16 0.68 -0.40 0.04 0.14 -0.14 -0.01 0.00 -0.01 0.02 0.20 0.06 0.00 0.00

PC15 0.00 0.02 0.00 0.00 -0.01 -0.02 -0.02 0.08 0.02 0.04 0.04 -0.06 0.03 0.02 -0.03 0.01 0.01 0.00 -0.02 -0.02 -0.17 0.97 0.10 0.00

PC16 0.00 0.01 0.01 0.00 -0.01 -0.01 -0.04 0.06 0.01 0.00 0.03 0.00 0.00 0.00 -0.04 0.00 0.01 -0.01 0.01 -0.02 -0.07 -0.12 0.98 0.14

PC17 0.10 0.02 0.03 0.00 -0.02 -0.02 -0.10 0.01 0.02 0.01 -0.01 0.00 0.00 0.00 0.01 0.00 0.02 0.01 0.01 -0.01 -0.02 0.00 -0.14 0.98

PC18 -0.07 -0.02 -0.01 -0.01 0.10 0.11 0.98 0.01 0.03 0.02 0.02 0.00 0.01 0.02 0.02 -0.01 -0.04 0.01 0.01 0.01 0.02 0.02 0.03 0.12

PC19 0.99 0.09 0.03 0.03 0.01 -0.03 0.08 0.02 0.02 0.00 0.00 0.00 0.00 -0.01 0.02 0.00 0.00 0.01 0.01 0.01 0.00 0.00 0.01 -0.09

PC20 0.03 0.07 0.02 0.04 -0.01 0.99 -0.11 0.00 0.02 0.01 0.01 0.01 0.01 0.01 0.01 0.00 -0.02 0.00 0.01 0.01 0.01 0.02 0.01 0.01

PC21 -0.10 0.98 0.16 0.05 0.00 -0.06 0.03 0.01 0.01 0.01 -0.01 0.00 -0.01 0.00 0.00 0.01 0.00 0.01 0.01 0.00 0.01 -0.02 -0.01 -0.01

PC22 -0.03 -0.17 0.88 0.38 0.22 -0.02 -0.01 0.01 0.00 0.00 0.01 0.00 0.00 0.01 0.00 0.00 0.01 0.00 0.01 0.00 0.01 0.00 0.00 -0.01

PC23 0.00 0.04 -0.30 0.17 0.93 -0.01 -0.10 0.01 0.00 0.00 0.00 -0.01 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.01

PC24 -0.02 0.00 -0.33 0.90 -0.27 -0.03 0.03 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.01

Page 72: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

63 5.3.2.2 Variância

Tabela 4 - Variância dos componentes da ACP aplicada a base de dados da cidade de Lisboa

Número de componentes

Variância por componente

Variância acumulada

1 9.31% 9.31% 2 8.92% 18.23% 3 8.17% 26.41% 4 7.57% 33.97% 5 7.39% 41.36% 6 6.93% 48.30% 7 6.53% 54.83% 8 5.66% 60.49% 9 5.30% 65.79%

10 4.88% 70.66% 11 4.60% 75.26% 12 4.47% 79.73% 13 4.29% 84.02% 14 4.17% 88.18% 15 3.20% 91.39% 16 2.37% 93.76% 17 1.60% 95.36% 18 1.37% 96.73% 19 1.12% 97.86% 20 0.75% 98.61% 21 0.55% 99.16% 22 0.35% 99.51% 23 0.28% 99.79% 24 0.21% 100.00%

Da mesma forma que na análise dos dados do usuário I, a partir da tabela 4 é

possível identificar a participação de cada componente na variância total dos dados, assim

como a variância acumulada, a medida em que são considerados mais componentes na

análise.

Por mais que a base original contasse com registros de 454 indivíduos, a análise

do Gráfico 5.1 permitiu concluir que a maioria desses usuários não usavam com

frequência o aplicativo e, portanto, não armazenavam uma quantidade significativa de

dados de suas rotinas. Dessa forma, o comportamento do grupo foi dominado pelos

registros dos poucos usuários que usavam o app com uma frequência muito superior aos

outros.

Page 73: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

64 Considerando os 12 componentes principais, é possível definir o padrão de

comportamento do grupo, representado pelos usuários do aplicativo BIKLIO da cidade

de Lisboa, com cerca de 80% de acurácia.

Mais uma vez, nota-se que os últimos componentes, principalmente a partir do

PC17, explicam muito pouco do comportamento dos usuários da cidade de Lisboa. Pode-

se concluir que mesmo na análise de grupo os padrões mais representativos de viagens

diárias são aqueles que contemplam um deslocamento pela parte da manhã,

provavelmente com destino de trabalho/estudo, e outro no final da tarde, com destino

casa.

5.3.3 Comparação de resultados

Comparando-se os dois resultados, é possível perceber que a aplicação da análise

de componentes principais no banco de dados de um único usuário do aplicativo fornece,

de forma geral, resultados mais representativos quanto aos padrões de viagem de

bicicleta. Fazendo uma análise da variância acumulada dos 5 componentes principais em

cada caso, no cenário do indivíduo, eles representam 53,9% da variância total da base de

dados, enquanto que na análise da cidade de Lisboa este número cai para 41,36%. Essa

diferença se justifica porque a rotina do usuário I, no primeiro cenário, não sofreu

interferência do comportamento dos demais usuários.

Outro ponto relevante é que o usuário I foi escolhido dentre aqueles que usavam

com mais frequência o aplicativo. É de se esperar que alguém que faz uso do app desde

o seu lançamento tenha um padrão diário de deslocamento de bicicleta mais bem definido

e, também, já tenha incorporado o uso do aplicativo na sua rotina, o que pode ter

contribuído para o aparecimento da diferença de resultados mencionada acima.

Além disso, analisando individualmente cada componente, é possível perceber

que as cargas fatoriais na primeira análise (do indivíduo) aparecem sempre concentradas

em duas ou três variáveis, o que permite traduzir melhor os padrões de comportamentos

observados. No segundo caso (da cidade de Lisboa), os componentes são mais difíceis de

serem interpretados porque as rotinas dos usuários se misturam e a distribuição das cargas

fatoriais fica mais caótica, como pode ser observado no PC4 desta análise. Apesar desse

componente explicar 7,57% do comportamento diário do grupo, ele não traduz com

clareza em quais momentos ocorrem as viagens.

Page 74: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

65 É possível notar, ainda, que os últimos componentes de ambas as análises eram

pouco representativos e que eles basicamente correspondiam às viagens realizadas em

horários bem específicos, ou seja, estavam associadas à apenas uma variável. Apesar da

análise da cidade de Lisboa contar com registros de viagens de 454 usuários, não houve

registro de comportamento rotineiro de viagens de bicicleta na parte da noite e de

madrugada, por exemplo.

Page 75: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

66 6 CONSIDERAÇÕES FINAIS

CONCLUSÃO

Este trabalho tem como principais objetivos: (i) expandir a literatura relacionada

ao tema da mobilidade urbana sustentável, (ii) expor a importância da análise de dados

como ferramenta para o desenvolvimento de cidades inteligentes e (iii) verificar os

resultados da aplicação de um método de análise multivariada em um banco de dados de

um aplicativo de mobilidade.

Conforme pôde ser observado ao longo do trabalho, a acelerado processo de

urbanização vivenciado nas cidades atualmente têm consequências sistemáticas na vida

dos cidadãos e no adequado funcionamento da infraestrutura urbana existente. No que

tange a mobilidade urbano, muito se tem discutido a respeito de mudanças em políticas

públicas e criação de novas tecnologias capazes de minimizar os impactos negativos

provocados pelo fortalecimento da cultura do transporte individual motorizado.

A partir da literatura existente, buscou-se detalhar os conceitos por trás da

mobilidade sustentável que, atualmente, devem englobar as três dimensões principais:

econômica, social e ambiental. Focando na mobilidade ativa como medida para tornar as

cidades socialmente justas, ambientalmente sustententáveis e economicamente viáveis,

foram expostos os benefícios associados ao uso da bicicleta, tanto para o usuário quanto

para a comunidade, assim como as vantagens relacionadas a integração da malha

cicloviária aos transportes de massa, principalmente.

Corroborando para o debate a respeito das vias para o desenvolvimento da

mobilidade sustentável nas cidades, foram apresentados projetos que alinham a

tecnologia da informação e comunicação (TIC) ao aperfeiçoamento de serviços de

mobilidade e de políticas públicas. Também nesse contexto, foi discutido a importância

da TIC na consolidação de cidades inteligentes e na transformação de dados em

informação e conhecimento eficaz.

Sendo assim, a partir de um banco de dados de um aplicativo de mobilidade, que

visa, sobretudo, fomentar o uso de bicicletas nos centros urbanos, foi aplicado a técnica

de análise multivariada conhecida por Análise de Componentes Principais (ACP). O

cerne da pesquisa fica justamente por conta das informações retiradas da modelagem e na

interpretação dos resultados de forma a identificar os padrões de comportamentos dos

usuários do aplicativo.

Page 76: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

67 Os resultados obtidos permitiram concluir que os padrões diários de viagens dos

usuários do aplicativo, considerando tanto uma análise individual quanto uma análise de

grupo, podem ser explicados por um número relativamente pequeno de componentes

principais. Na modelagem, as horas do dia representavam as variáveis independentes da

análise e, observando o peso que cada variável tinha sobre os componentes principais,

concluiu-se que os usuários mantinham um comportamento rotineiro e pendular, que

traduziam boa parte do histórico diário de deslocamentos por bicicleta usando o

aplicativo.

PESQUISAS FUTURAS

A pesquisa revela o potencial da análise de componentes principais em identificar

padrões diários do comportamento humano, neste caso, com relação à mobilidade por

bicicleta. Entretanto, a metodologia e o modelo implementados também estão sujeitos a

aprimoramentos.

Em trabalhos futuros, pode-se, por exemplo, fazer uma comparação dos

componentes principais, que definem os padrões diários de deslocamento mais relevantes,

em grupos de cidades culturalmente diferentes. Seria relevante, também, que a análise

fosse feita a partir de um banco de dados de sistemas de compartilhamentos de bicicletas,

os quais enfrentam muitos desafios relacionados à previsão de demanda e realocação dos

equipamentos. Outra possibilidade de extensão da pesquisa é com relação a interpretação

dos resultados de análise feitas em bases de diferentes grupos de usuários, como jovens e

adultos, mulheres e homens ou turistas e residentes, de forma que se possa até prever

comportamentos de determinados grupos sociais.

Page 77: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

68 REFERÊNCIAS BIBLIOGRÁFICAS

ABLEY, S., HALDEN. D. The New Zealand accessibility analysis methodology. NZ Transport Agency research - report 512. New Zealand, 2013.

ANDRADE, J. N. e GALVÃO, D., 2016, O Conceito de Smart Cities aliado à Mobilidade Urbana. Revista HumanÆ. Questões controversas do mundo contemporâneo, v. 10, n. 1- (Ano, 2016)

LEMOS, A., “Cidades Inteligentes: de que forma as novas tecnologias —como a computação em nuvem, o big data e a internet das coisas — podem melhorar a condição de vida nos espaços urbanos?”. http://dx.doi.org/10.12660/gvexec.v12n2.2013.20720

AVILA, T., 2017, “O que faremos com 40 trilhões de gigabytes de dados disponíveis em 2020?” Disponível em : https://br.okfn.org/2017/09/29/o-que-faremos-com-os-40-trilhoes-de-gigabytes-de-dados-disponiveis-em-2020/. Acesso em: 1 set. 2019.

BERNARDES, R. C. et al., 2017, Cidades Inteligentes: casos e perspectivas para as cidades brasileiras. Led. Revista Tecnológica da Fatec Americana, vol. 05, n. 01, out-206/mar-2017.

BRONS, M., Givoni, M., Rietveld, P., 2009, “Access to railway stations and its potential in increasing rail use”, Transportation Research Part A, 43: 136-149, http://dx.doi.org/10.1016/j.tra.2008.08.002

C40 SÃO PAULO CLIMATE SUMMIT, 2011. Síntese do C40 São Paulo Climate Summit 2011. São Paulo: Prefeitura de São Paulo, 2011.

CARAGLIU, A., Del Bo, C. & Nijkamp, P., 2011. Smart cities in Europe. Journal of urban technology, 18(2), 65-82.

CARVALHO, L., 2017. Análise fatorial: um importante técnica multivariada. Disponível em: https://www.abgconsultoria.com.br/blog/analise-fatorial/. Acesso em: 20 set. 2019.

CARVALHO, C., 2016, “Mobilidade Urbana Sustentável: Conceitos, Tendências e Reflexões”. Disponível em: < http://repositorio.ipea.gov.br/bitstream/11058/6664/1/td_2198.pdf> Acesso em: 20 set. 2019

CERVERO, R., Caldwell, B., Cuellar, J., 2012, “Bike-and-Ride: Build It and They Will Come”, Institute of Transport Studies, University of California, Working Paper 2012-5, http://its.berkeley.edu/sites/default/files/publications/UCB/2012/VWP/UCB-ITS-VWP-2012-5.pdf

COSTA, M.S.; SILVA ,A.N.R.; RAMOS R.A.R., 2004, Indicadores de Mobilidade Urbana Sustentável para o Brasil e Portugal. CD: Workshop “Plano Integrado: em busca de desenvolvimento Sustentável para Cidades de Pequeno e Médio Portes”. Universidade do Minho, Braga, Portugal, 2004.

Page 78: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

69 COSTA, M. da S. Um índice de mobilidade urbana sustentável. Tese de Doutorado. São

Paulo: Universidade Federal de São Carlos, 2008.

COMISSÃO EUROPÉIA, 2000, Cidades para Bicicletas, Cidades de Futuro, Luxemburgo, Serviços das Publicações Oficiais das Comunidades Européias.

CURTIS, C., 2008, Planning for sustainable accessibility: the implementation challenge. Transport Policy, 15, 104-112, 2008.

CRUZ, W., 2015, Bicicletas atrapalham o trânsito?. Disponível em: < http://vadebike.org/2012/03/bicicletas-nao-atrapalham-o-transito/>. Acesso em: 23 mar, 2020

DAMASIO, B. F., 2012. Uso da análise fatorial exploratória em psicologia. Avaliação Psicológica, 2012, 11(2), pp. 213-228

DELLOITE, 2017. “Assessing the value of TfL’s open data and digital partnerships”.

DUTTA, S. et al., 2012. The Global Innovation Index 2011: accelerating growth and development. Fontainebleau: INSEAD, 2011. ERNST

EAGLE, N. e PENTLAND, A., 2009, Reality mining: sensing complex social systems. Pers Ubiquit Comput 4:255–268

ELLEN MACARTHUR FOUNDATION, 2015, Growth Within: a circular economy vision for a competitive Europe (2015)

ELLEN MACARTHUR FOUNDATION, 2019, Circular Economy in Cities, Disponível em: < www.ellenmacarthurfoundation.org/our-work/activities/> Acesso em: 4 nov. 2019

EPA., 2012, Sources of greenhouse gas emissions. United States Environmental Protection Agency, 2012.

FERSI/ ECTRI., 2009, The sustainable safety approach to Road Transport and Mobility. Road Safety Roadmap (Final Version, 23.01.09).

FIGUEIREDO FILHO, Dalson Brito; SILVA JUNIOR, José Alexandre da, 2010. Visão além do alcance: uma introdução à análise fatorial. Opin. Publica, Campinas , v. 16, n. 1, p. 160-185, June 2010

FINGER, B. et al., 2017. Research for TRAN Committee – Infrastructure funding challenges in the sharing economy, European Parliament, Policy Department for Structural and Cohesion Policies, Brussels

FIRJAN, 2019. Post sobre cidades inteligentes. Disponível em: https://www.instagram.com/casafirjan/

FISHMAN, E., 2016, Bikeshare: A Review of Recent Literature, Transport Reviews: A Transnational Transdisciplinary Journal

GANTZ, J., RAISEL, D., 2012, “The Digital Universe In 2020: Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East. EMC Corporation”. Disponível

Page 79: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

70 em: http://www.emc.com/collateral/analyst-reports/idc-the-digital-universe-in-

2020.pdf. Acesso em: 10 set. 2019.

GÄRLING, T, Eek, D, Loukopoulos, P, Fujii, S, Johansson-Stenman, O, Kitamura, R, Pendyala, R. E Vilhelmson, B., 2003, “A Conceptual Analysis of Impact of Travel Demand Management on Private Car Use”. Running Head: Impacts of Travel Demand Management. Transport Policy, 9(1), p. 59-70.

HADDAD, P. R., 2001, Clusters e desenvolvimento regional no Brasil. Revista Brasileira de Competitividade, ano 1, no 2, ago-nov./2001.

HAIR, J. F., Anderson, R. E., Tatham, R. L. & Black, W. C., 2005. Análise multivariada de dados. Publicado por Bookman Companhia Editora Ltda.

HOLDEN, E., LINNERUD, K., BANISTER, D. Sustainable passenger transport: back to Brundtland. Transportation Research Part A, 54, 2013, p.67-77.

JOLLIFFE, I. T., 2012. Principal Component Analysis, Second Edition.

JOLLIFFE, I. T. e MORGAN, B. J. S., 1992. Principal component analysis and exploratory factor analysis. Stat Methods Med Res 1992 1: 69 DOI: 10.1177/096228029200100105

KAGER, R. E HARMS, L., 2017, Synergies from Improved Cycling -Transit Integration: Towards an integrated urban mobility system. Prepared for the Roundtable on Integrated and Sustainable Urban Transport 24-25 April 2017, Tokyo

KLINGER, T., 2017, Moving from monomodality to multimodality? Changes in mode choice of new residents. Transportation Research Part A (in press) http://dx.doi.org/10.1016/j.tra.2017.01.008

KUMAR, V., Chattaraman, V., Neghina, C., Skiera, B., Aksoy, L., Buoye, A. & Henseler, J., 2013. Data-driven services marketing in a connected world. Journal of Service Management, 24(3), 330-352.

KUSAKABE, E., 2013, Advancing sustainable development at the local level: the case of machisukuri in Janapense cities. Progress in Planning, 80, pp. 1-65, 2013.

LEMOS, D. S. da C. P. da S., 2011, Análise das relações existentes entre a acessibilidade e o desenvolvimento no município de Petrópolis. Tese de Doutorado. Rio de Janeiro: UFRJ, 2011.

LIM, C. H., Kim, M. J., Heo, J. Y. & Kim, K. J., 2015. Design of informatics-based services in manufacturing industries: case studies using large vehicle-related databases. Journal of Intelligent Manufacturing.

LITMAN, T., 2008, Sustaibable transportation indicators: a recommended research program for developing sustainable transportation indicators and data. Paper 09-3403. Transportation Research Board Annual Meeting, 2008.

Page 80: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

71 LITMAN, T., 2015, Evaluating accessibility for transportation planning measuring

people’s ability to reach desired goods and activities. Victoria Transport Policy Institute. 56 p., 2015.

LITMAN, T., FITZROY, S. Safe travels: evaluating mobility management traffic safety impacts. Victoria Transport Policy Institute. 64 p., 2014

LUZ, G., 2018, Mobility as a Service na promoção da mobilidade sustentável: O caso do Rio de Janeiro. Projeto de Graduação – UFRJ / Escola Politécnica / Rio de Janeiro

MACHADO, L., 2010, Índice de mobilidade sustentável para avaliar a qualidade de vida urbana: estudo de caso na região metropolitana de Porto Alegre. Dissertação de Mestrado. Porto Alegre: Universidade Federal do Rio Grande do Sul, 2010.

MAGLIO, P. e LIM, C., 2016. Innovation and Big Data in Smart Service Systems. Journal of Innovation Management (2016).

MANLY, B. F. J., 2005. Multivariate Statistical Methods: A primer. Fourth edition.

MANYKA, J., Chui, M., Brown, B., Bughin, J, Dobbs, R., Roxburgh, C., and Byers, A., 2011. Big data: The Next Frontier For Innovation, Competition, And Productivity. McKinsey Global Institute. Disponível em: http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation. Acesso em: 30 ago. 2019

MELLO, A. J. R. A Acessibilidade ao Emprego e Sua Relação Com a Mobilidade e o Desenvolvimento Sustentáveis: o caso da Região Metropolitana do Rio de Janeiro. Rio de Janeiro, 2015. Tese (Doutorado em Engenharia de Transportes) – Programa de Engenharia de Transportes, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2015.

MINISTÉRIO DAS CIDADES, 2007b, Plano de Mobilidade por Bicicleta nas Cidades, Coleção Bicicleta Brasil, caderno 1, Secretaria Nacional de Transporte e da Mobilidade Urbana, Brasília.

MINITAB, 2019. Disponível em: https://support.minitab.com/pt-br/minitab/18/help-and-how-to/statistics/basic-statistics/supporting-topics/correlation-and-covariance/what-is-covariance/. Acesso em: 20 set. 2019

ONU, 2012. World Urbanization Prospects, The 2011 revision, 2012. Disponível em http://esa.un.org/unpd/wup/index.htm. Acesso em 15. set. 2019.

ONU, 2019, “ Transformando Nosso Mundo: A Agenda 2030 para o Desenvolvimento sustentável” Disponível em: < https://nacoesunidas.org/pos2015/agenda2030/> Acesso em: 20 out. 2019

PITOMBO, C. S. e LINDNER, A., 2016. Modelo logit binomial com componentes principais para estimação de preferência por modo de transporte motorizado. The Journal of Trnsport Literature.

PORTER, C. D., Brown, A., Deflorio, J., Mckenzie, E., Tao, W., Vimmerstedt, L., 2013, Effects of travel reduction and efficient driving on transportation: energy use and greenhouse gas emissions. Transportation Energy Future Series. 98p, 2013.

Page 81: UNIVERSIDADE FEDERAL DO RIO DE JANEIRO USO DE BIG …USE OF BIG DATA TO FURTHER SUSTAINABLE MOBILITY: APLICATION OF PRINCIPLE COMPONENT ANALYSIS TO IDENTIFY STRUCTURE IN ROUTINE OF

72 PUCHER, J., Dill, J. and Handy, S., 2010, “Infrastructure, programs, and policies to

increase bicycling: An international review”, Preventive Medicine, 50

SAHA, S. 2018. “Baffled by Covariance and Correlation??? Get the Math and the Application in Analytics for both the terms..”. Disponível em: https://towardsdatascience.com/let-us-understand-the-correlation-matrix-and-covariance-matrix-d42e6b643c22. Acesso em: 20 set. 2019.

SARTORIO, S. D., 2008. Aplicações de técnicas de análise multivariada em experimentos agropecuários usando o software R. Dissertação apresentada para obtenção do título de Mestre em Agronomia.

SHAHEEN, S., GUZMAN, S. e ZHANG, H., 2010, Bikesharing in Europe, the Americas, and Asia, Transportation Research Record: Journal of the Transportation Research Board.

SILVEIRA, M. O., 2010, Mobilidade Sustentável: A Bicicleta Como Um Meio De Transporte Integrado. Dissertação de Mestrado, COPPE, da UFRJ

SINDIPEÇAS e ABIPEÇAS, 2019, Relatório da Frota Circulante. Disponível em: < https://www.sindipecas.org.br/sindinews/Economia/2019/RelatorioFrotaCirculante_Maio_2019.pdf> Acesso em: 10 jan. 2020

SOUZA, A., 1995. Aplicações De Algumas Técnicas Multivariadas. Disponível em: ftp://ftp.ufv.br/def/disciplinas/ENF642/ApostilaTECMULTIVARIADAS

UITP., 2003, Better urban mobility in developing countries: solutions and good practices. Union Internationale des Transports Publics. Brussels. December. 43 p., 2003

UN HABITAT, 2013, Planning and Design for sustainable urban mobility. Global report on human settlements 2013 - United Nations Human Settlements Programme

TRACE, 2019. Disponível em: http://h2020-trace.eu/trace-tools/biklio/

VASCONCELLOS, E. A., 2011, “Transporte e mobilidade urbana”. Disponível em: < http://repositorio.ipea.gov.br/bitstream/11058/1373/1> Acesso em: 10 jan. 2019

WAPC., 2012, Guidelines for preparation of integrated transport plans. Western Australian Planning Commission, 2012.

WCED. World Comission on Environment and Development. Our Commom Future. Oxford and New York: Oxford University Press, 1987. Disponível em: http://www.un- documents.net/ourcommon-future.pdf

WELCH, T.F. & MISHRA, S., 2013, A measure of equity for public transit connectivity. Journal of Transport Geography, 33, 29–41, 2013.

WELCH, T.F.,2013, Equity in transport: The distribution of transit access and connectivity among affordable housing units. Transport Policy, 30, 283–293, 2013.

WOLFRAM, M., 2012. Deconstructing smart cities: an intertextual reading of concepts and practices for integrated urban and ICT development. 2012. p. 171-181.