Introdução à Ciência das Redes -...

50
Introdução à Ciência das Redes Gustavo Vasconcellos Cavalcante Biblioteca Nacional de Brasília – Outubro de 2010

Transcript of Introdução à Ciência das Redes -...

Introdução à Ciência das RedesGustavo Vasconcellos Cavalcante

Biblioteca Nacional de Brasília – Outubro de 2010

“Conecto Ergo Sum”(Björneborn, 1998)

“A verdadeira viagem da descoberta não é achar novasterras, mas ver o território com novos olhos”

Marcel Proust

© 2010 Gustavo V. Cavalcante [email protected]

Motivação

Cientistas descobriram que a arquiteturasubjacente a vários sistemas complexos égovernada pelos mesmos princípiosorganizadores.

Essa descoberta tem implicações para umconjunto de resultados, do desenvolvimento demedicamentos à segurança na Internet.

© 2010 Gustavo V. Cavalcante [email protected]

O que são Redes?

Sistemas compostos de vértices (nós) e arestas.

© 2010 Gustavo V. Cavalcante [email protected]

Exemplos

Redes sociais: os vértices são indivíduos e asextremidades são interações sociais entre eles.

Redes genéticas: as proteínas e genes são os vértices eas extremidades são reações químicas.

Redes Informacionais: World Wide Web (WWW): os vértices são os documentos HTML

cujas extremidades são apontadores de uma página à outra. Redes de Citações entre pesquisadores.

Redes neuronais: os vértices são neurônios conectadospor axônios.

As sociedades: os vértices são pessoas unidas poramizades, laços familiares e profissionais.

Redes alimentares, ecossistemas. Redes de energia elétrica e os sistemas de transporte.

© 2010 Gustavo V. Cavalcante [email protected]

Todo X Parte

É possível observar que, em grande parte das vezes, oestudo dos elementos constituintes de uma rede éinsuficiente para explicar o seu comportamento.

Propriedades fundamentais da rede estão presentes emsua própria topologia, na descrição física ou geométricadas mesmas. Estes elementos são perdidos quando o focodeixa de ser a rede e passa a incidir apenas nos itens.

Examinar apenas um neurônio não é o suficiente paradescrever o cérebro

© 2010 Gustavo V. Cavalcante [email protected]

Reducionismo

Esta característica apresentada pela redes,pela qual aobservação das partes não é capaz de descrever o todo.

Reducionismo, em filosofia, é o termo que designa todaatitude teórica que, para explicar um fenômenocomplexo, procura reduzi-lo aos elementos simples queo constituem

O Reducionismo foi a força motora por trás de grandeparte da pesquisa realizada no século 20. A ciênciapregava que para compreender a natureza eranecessário primeiro decifrar seus componentes.

© 2010 Gustavo V. Cavalcante [email protected]

Complexidade

O problema é quando escapa-se do Reducionismo esbarra-se nocampo árido da complexidade.

Em sistemas complexos, determinados resultados podem serinstáveis no que diz respeito à evolução temporal como função deseus parâmetros e variáveis. Isso significa que certos resultadosdeterminados são causados pela ação e a interação de elementosde forma praticamente aleatória.

A proposta da complexidade é a abordagem transdisciplinar dosfenômenos, e a mudança de paradigma, abandonando oreducionismo que tem pautado a investigação científica em todosos campos, e dando lugar à criatividade e ao caos.

© 2010 Gustavo V. Cavalcante [email protected]

Conteúdo

1. Os precursores

2. Mundo Pequeno

3. Concentradores e Conectores

4. Pareto e as Redes livre de escala

5. Ciência da Informação e C. das Redes

© 2010 Gustavo V. Cavalcante [email protected]

1) Os precursores

Mapa daInternet

© 2010 Gustavo V. Cavalcante [email protected]

E tudo começou com a Teoria dosGrafos .....

Leonhard Euler1707 - 1783

- Considerado o pai da teoria dos grafos.

O mapa de Königsberg noséculo XVIII, Mostrando o rioe as sete pontes que inspiraramEuler a criar o seu primeirografo, criando a teoria dosgrafos. Podemos cruzar as 7pontes, nunca passando poruma ponte mais de uma vez ?

© 2010 Gustavo V. Cavalcante [email protected]

Solução do Problema...

Euler (1736) percebeuque só seria possívelatravessar o caminhointeiro passando umaúnica vez em cadaponte se houvessem nomáximo dois pontosde onde saia umnúmero ímpar decaminhos

© 2010 Gustavo V. Cavalcante [email protected]

Que por curiosidade ....

Vista aérea de Kaliningrado (antiga Königsberg).Outubro 2010 (Fonte: Google Earth)

© 2010 Gustavo V. Cavalcante [email protected]

Análise de Redes Sociais

Rede Social é uma dasformas de representação dosrelacionamentos afetivos ouprofissionais dos sereshumanos entre si ou entreseus agrupamentos deinteresses mútuos. Uma redesocial, portanto, consiste deum ou mais conjuntos finitosde atores [e eventos]e todasas relações definidas entreeles.

© 2010 Gustavo V. Cavalcante [email protected]

Análise de Redes Sociais

A Análise de Redes Sociais esta associada a um conjunto demétodos e técnicas cujo o objetivo é a análise das relações entreatores sociais. Grande parte de sua terminologia, tais como:centralidade de ator, tamanho do caminho, componentesconectados, dentre outros, foram retirados diretamente da teoria dosgrafos, ou adaptados diretamente desta ciência.

A utilização da Análise de Redes Sociais vem crescendo de formasignificativa nos últimos 20 anos em virtude do aumento daquantidade de dados disponíveis para análise, com o aumento dopoder computacional e a ampliação das áreas de conhecimentos queutilizam esta técnica

© 2010 Gustavo V. Cavalcante [email protected]

E agora os matemáticos

Nas década de 50 e 60 a contribuição damatemática impulsionou o desenvolvimento dasredes. Seu objeto de investigação era pensarem grafos como um meio pelo qual váriosmodos de influência - doenças e informações,por exemplo, poderiam se propagar. Destaépoca é possível destacar os trabalhos deRapoport e Solomonoff e de Erdös e Rényi.

© 2010 Gustavo V. Cavalcante [email protected]

Rapoport e Solomonoff

Nos anos 50, Rapoport estava estudando o alastramento de doenças empopulações humanas como parte de grupo de pesquisa em matemáticabiofísica na Universidade de Chicago. Na época , muitos pesquisadoresignoravam os aspectos sociais das interações humanas noespalhamento de doenças.

Rapoport era um homem incomum para o seu tempo. Tinha interesse pormatemática biológica em uma época em que essas ciências não secomunicavam. Era um visionário que vislumbrou décadas antes aimportância e as propriedades das redes, desenvolvendo métodos quese concentravam nas propriedades estatísticas gerais das redes, como écomum atualmente, ao invés das propriedades particulares dos nós evértices

© 2010 Gustavo V. Cavalcante [email protected]

E agora vamos para o final da Década de 50 quandodois gênios da matemática se encontram ...

Paul Erdös Talvez o

matemático maisprolífico de todosos tempos.

Alfréd Rényi

Os dois fundarama teoria das

RedesRandômicas

(1959)

© 2010 Gustavo V. Cavalcante [email protected]

Exemplo: Convidados em umafesta

Exemplo:Convidadosde uma festa,Computadores ligadospor linhas telefônicas,moléculas em nossocorpo ligado porreações bioquímicas,companhias econsumidores ligadospor negociações, etc...

© 2010 Gustavo V. Cavalcante [email protected]

Só que Deus não jogadados ...

As redes do mundo real sãorandômicas ?

© 2010 Gustavo V. Cavalcante [email protected]

2) Mundo Pequeno

© 2010 Gustavo V. Cavalcante [email protected]

Mundo Pequeno

Qual é o problema domundo pequeno ?

© 2010 Gustavo V. Cavalcante [email protected]

Histórico

O conceito apareceu pela primeiravez no livro do escrito HúngaroFrygyes Karinthy - Cadeias - 1929Curiosidade: 5 graus deseparação

Um de nós sugeriu executar o seguinte experimento para provar que a população daterra está ficando cada vez mais próxima, agora, do que ela esteve antes. Nós podemosselecionar qualquer pessoa das 1.5 bilhões de habitantes da terra - qualquer pessoa, dequalquer lugar. Ele faz uma aposta conosco que usando no máximo que cincoindivíduos, um dos quais é um conhecido pessoal, ele pode contatar o indivíduoselecionado usando nada mais que a sua rede de pessoas conhecidas. Por exemplo,``Veja, você conhece o Sr. X.Y., por favor peça a ele para contatar seu amigo o Sr. Q.Z.,que ele conhece, e assim em diante.

© 2010 Gustavo V. Cavalcante [email protected]

Histórico

A idéia de cadeias aparece novamente naliteratura no livro de Jane Jacobesintitulado The Death and Life of GreatAmerican Cities.

Neste livro, publicado originalmente em1961 também é apresentado um jogo,neste caso chamado de Mensagens ondeo ganhador será a pessoa que conseguirenviar uma mensagem oral entre duaspessoas quaisquer, usando a cadeia maiscurta.

O sociólogo americano Stanley Milgranpublicou pesquisa a esse respeito em1967Curiosidade: 5.5 graus

© 2010 Gustavo V. Cavalcante [email protected]

Histórico (Cont.)

Um pôster da peça "6graus de separação" deJohn Guare -1991 - queposteriormente foitransformada em filme.Foi a responsável pelapopularização do termo

"Everybody on this planet is separated byonly six other people. Six degrees ofseparation. Between us and everybody elsein this planet. The president of the UnitedStates. A gondolier in Venice. . . . It's not justthe big naipes. It's anyone. A native in a rainforest. A Tierra del Fuegan.. An Eskimo. I ambound to everyone on this planet by a trail ofsix people. It's a profound thought. . . . Howevery person is a new door opening up intoother worlds."

Trecho da peça “6 graus de separação”

© 2010 Gustavo V. Cavalcante [email protected]

Mundo PequenoAtualmente Em 2001, Duncan Watts, um professor da Columbia

University, recriou o experimento de Milgram na Internet. Watts usou mensagens de e-mail as e

surpreendentemente, após revisar os dados coletadospor 48,000 remetentes e 19 alvos (em 157 países),Watts encontrou que o número médio de intermediárioscontinuava sendo, seis.

A pesquisa de Watts, e o advento da era computacional,tem aberto um campo a novas áreas de investigaçãorelacionadas a diversas áreas da teoria de redes: taiscomo análise da rede elétrica, transmissão de doenças,teoria dos grafos, comunicações coorporativas e por quenão ? Arquitetura da Informação.

© 2010 Gustavo V. Cavalcante [email protected]

A Força dos Links Fracos ...

Mark Granovetter -Sociólogo,que em 1973, publicou opaper "A força dos linksfracos" que trouxe aoconhecimento da Sociologiaa existência de comunidadesnas redes sociais.

Clustering

© 2010 Gustavo V. Cavalcante [email protected]

A Força dos Links Fracos ...

Duncan Watts &Steven Strogatz

Os primeiros aapontar apresença decluster nas redesreais (1998).Ex:Redes sociais,Web, RedesElétricas, célulasnervosas, etc.

© 2010 Gustavo V. Cavalcante [email protected]

Exemplo de Mundos Pequenos

Exemplo de Mundos Pequenos:

2) O Número Erdos.http://www.oakland.edu/~grossman/erdoshp.html

1) O jogo de Kevin Bacon

© 2010 Gustavo V. Cavalcante [email protected]

Histórico (Cont.)

Nosso mundo é pequeno porque a sociedade é uma teiamuito densa. Nós temos muito mais amigos do que onecessário para estar conectado.

© 2010 Gustavo V. Cavalcante [email protected]

3) Concentradores e Conectores(Hubs)

Redes de Co-autoriana Física

© 2010 Gustavo V. Cavalcante [email protected]

Conectores

Conectores são pessoas com umagrande capacidade de fazer amigos econhecidos. São uma peçafundamental nas redes sociais.

O Interessante é que Conectores(nodos com um grande número delinks) estão presentes em outrasredes, desde a economia até ascélulas. De uma maneira geralchamamos estes conectores de Hubs(concentradores).

© 2010 Gustavo V. Cavalcante [email protected]

Conectores (continuação)

Hubs dominam a estrutura das redes em queestão presentes. Eles criam um caminhoreduzido entre quaisquer nós do sistema.

Ao levar em conta estes nós altamenteconectados abandonamos de uma vez por todaso modelo de mundo randômico.

© 2010 Gustavo V. Cavalcante [email protected]

4) Pareto e as Redes livre deescala

Vilfedo Pareto - Economista Italiano autor da regra 80/20 Exemplos:

80% links na web apontam para 15% dos sites.

80 % das citações são para 38% dos cientistas

80% dos links em Holywood vão para 30% dos atores

Pareto nunca usou a frase 80/20

© 2010 Gustavo V. Cavalcante [email protected]

Pareto e as Redes livre deescala (cont.)

Parece que todos os sistemas que seguem a Lei dePareto, como a Web por exemplo, apresentam umacaracterística especial...

Um pouco de estatística:

© 2010 Gustavo V. Cavalcante [email protected]

Como já vimos antes, havia asRedes Aleatórias. Os nós obedecem a uma distribuição de

Poisson, em forma de sino, e os nós comum número de links significativamentesuperior ou inferior à média sãoextremamente raros.

Apesar da localização randômica doslinks, a maioria dos nós teráaproximadamente a mesma quantidadede conexões.

Tradicionalmente, a ciência tratou asredes complexas como sendocompletamente aleatórias.

© 2010 Gustavo V. Cavalcante [email protected]

Redes Livre de Escala

© 2010 Gustavo V. Cavalcante [email protected]

Redes Livre de Escala

Em 1999 - Com Barabasi, surge oconceito de redes livres de escala.

O fato de várias destas redesserem livres de escala dãolegitimidade aos Hubs(concentradores).

Os Hubs determinam aestabilidade, comportamentodinâmico, robustez e tolerância aerros e ataques em uma rede domundo real.

© 2010 Gustavo V. Cavalcante [email protected]

Redes Livre de Escala(Continuação)

A quantidade de nós cresce continuamente.

Há uma vinculação preferencial.

Isso implica que certos nós possuem umaquantidade enorme de conexões com outrosnós, enquanto a maioria dos nós tempoucas conexões. Os nós mais visitados,denominados pólos de irradiação econvergência, podem ter centenas, milharesou mesmo milhões de links. Nesse sentido,a rede parece não ter uma escala

© 2010 Gustavo V. Cavalcante [email protected]

Redes Livre de Escala(Continuação)

© 2010 Gustavo V. Cavalcante [email protected]

Por que a maioria das redes domundo real são livre de escala ?

Rico fica mais rico (EfeitoMateus): Crescimento Acoplamento Preferencial

Aptidão do nó

© 2010 Gustavo V. Cavalcante [email protected]

5) Robustez de uma rede livre deescala

É fácil esquecer como somos dependentes datecnologia.

Uma propriedade curiosa das redes scale-free é que,do ponto de vista de manter a sua funcionalidade, sãomuito robustas em relação à remoção aleatória dealguns dos seus nodos ou ligações.

Atingir a robustez é o objetivo de especialistas nacrescente interdependência dos sistemas.

Quantos nós podem ser eliminados randomicamentede uma rede para quebrar estas em pedaços ?

© 2010 Gustavo V. Cavalcante [email protected]

© 2010 Gustavo V. Cavalcante [email protected]

Robustez de uma rede livre deescala (continuação)

Pesquisas indicam que as redes livres de escalacom a Internet são bem resistentes a falhasrandômicas. Chegaram em simulação a retirar80% dos links e os 20% restantespermaneceram conectados.

Por outro lado estas redes são extremamentefrágeis ao ataque direto aos seus principaishubs.

© 2010 Gustavo V. Cavalcante [email protected]

Aninhamento

De uma certa maneira,podemos dizer que muitasredes são como bonecasrussas. Uma se situa dentroda outra. Muitas das redespodem ser pensadas comoelementos estruturantesde outra rede de ordemsuperior, chamada de redesuperior (top network ). Deforma similar esta rede deordem superior se constituiuma rede completa, comestrutura complexa eestabilidade.

Neste caso, cada nó da rede de ordemsuperior é constituída de uma rede deordem inferior. Como exemplo: Uma redede ordem superior poderia ser uma rede deneurônios, onde os elementos desta redesão os neurônios. Por sua vez, cadaneurônio pode ser pensado como umarede de proteínas.

© 2010 Gustavo V. Cavalcante [email protected]

Ciência da Informação e aCiência das Redes O tradicional ARIST ( Annual Review of Information Science &

Technology) produzido pela American Society for InformationScience & Technology (ASIST) publicou na sua edição de 2007 umcapítulo sobre a nascente ciência das redes (BORNER; SANYAL;VESPIGNANI, 2007)

Estuda Tradicionalmente Redes Informacionais: WWW Redes de comunicação de e-mails Redes Sociais (também são redes de Informação) Redes de Citações entre pesquisadores Redes de Citações entre patentes e entre citações legais Redes de recomendação Redes de Indexação keywords

© 2010 Gustavo V. Cavalcante [email protected]

Ciência da Informação –Pioneira na Ciência das Redes

Derek J. de Solla Price(1922-1983)

• “Networks of Scientific Papers” (1965)

• “A general theory of bibliometrics and othercumulative advantage processes” (1976)

• Price apresenta:• Leis de Potência• Acoplamento Preferencial (vantagem

acumulativa) – desenvolveu uma teoriamatemática para explicar este fenômeno.

© 2010 Gustavo V. Cavalcante [email protected]

Finalizando

A noção central da ciência da rede ensina que o demônio nãose esconde nos detalhes, mas sim nas relações, nacomplexidade das interações entre pessoas, aviões,computadores, moléculas, e que de nada adianta estudarcada um desses comportamentos individualmente.

“Todo toca todo”Jorge Luís Borges

© 2010 Gustavo V. Cavalcante [email protected]

7) RecomendaçõesBibliográficas

Obrigado pela Atenção

[email protected]