Análise de Centralidade

29
Análise de Centralidade Ricardo Prudêncio Tópicos Avançados em Inteligência Artificial

description

Análise de Centralidade. Ricard o Prudêncio Tópicos Avançados em Inteligência Artificial. Roteiro. Introdução Medidas de centralidade Medidas principais Grau, intermediação e proximidade Medidas alternativas Centralização Conclusões. Introdução. Problema - PowerPoint PPT Presentation

Transcript of Análise de Centralidade

Mining Social Networks

Anlise de CentralidadeRicardo Prudncio

Tpicos Avanados em Inteligncia ArtificialRoteiroIntroduoMedidas de centralidadeMedidas principaisGrau, intermediao e proximidadeMedidas alternativasCentralizao Concluses2IntroduoProblemaQue ns so importantes dentro de uma rede?

Quais ns so importantes estruturalmente e relevantes para o fluxo de informao na rede

Anlise de centralidade3CentralidadeConsidere a rede ao lado em formato de estrela

Intuitivamente, o n A o mais central de todos

Posio estratgica considerando a estrutura da rede

O que A tem de diferente?!ACDBGFECentralidade(1) N A tem maior nmero de conexes com outros nsGrau

(2) N A est sempre entre dois ns quaisquer Intermediao

(3) N A est mais prximo aos outros ns da redeProximidade ACDBGFETrs propriedades que levam a trs diferentes conceitos de centralidade Ver (Freeman 1978)GrauGrau = No. de links adjacentes a um n

Em um processo de comunicao na rede, n de grau alto um canal direto de informaoPopularidade e influncia direta

Ns com grande potencial de atividade dentro de uma redeGrau

Fator de normalizao para comparao entre redes

Obs.: n-1 o grau mximo de uma rede em estrelaNmero de ns adjacentes

Obs.: Redes sem pesos: wkj = 1 se existe link entre ns vk e vj

GrauEm grafos direcionados importante diferenciar graus de entrada e sada

Grau de entrada (in-degree) = no. de links que chegam a um nE.g., no. de seguidores no Twitter (in-degree) = prestgio(?)

Grau de sada (out-degree) = no. de links que saem de um nE.g., na relao de manda em, out-degree = alta influnciaGrau - LimitaesGrau uma medida de centralidade localnodes may be well connected to their immediate neighbors but be part of a relatively isolated clique (Liu 2008)

Dois ns com o mesmo grau podem no ter a mesma capacidade de influenciarE.g., se grau usado para medir influncia local, ento poder do n depende de quem so os seus vizinhos e do tipo de interaoE.g., nmero de seguidores no Twitter no reflete diretamente a influncia dentro da rede (como nmero de retwittes)9IntermediaoMede a frequncia com que o n aparece no menor caminho entre dois ns quaisquer

Ns com grande potencial de controle do fluxo de informao na redeACDBGFETodas as mensagens na rede passam por n A!10IntermediaoNs com alto controle:Podem ajudar na coordenao de processos dentro de um grupoPodem influenciar na comunicao da rede, atrasando ou perturbao o fluxo de informaoThe more people depend on me to make connections with other people, the more power I have (Hanneman 1998)

Quanto mais as pessoas dependem de mim para fazer conexes com outras pessoas, mais poder que eu tenho.11IntermediaoPotencial para conectar comunidades diferentes

Eliminar ns de alta intermediao pode ter o efeito de desconectar a redePropriedade usada em algoritmos de deteco de comunidades

12Intermediao

: Nmero de caminhos geodsicos entre vi e vj que passam por vk

: Nmero total de caminhos geodsicos entre vi e vjSoma para todos os pares diferentes de ns vi e vjIntermediao

Medida normalizada para comparao entre redes

Grau de intermediao do n mais central em uma rede em formato estrelaC2= (n-1)(n-2)2in the case that order of choosing units in pair is notimportant (undirected network)14

Rede de contatos de pacientes com TuberculoseFonte: Andre et al., Transmission Network Analysis to Complement Routine Tuberculosis Contact Investigations. American Journal of Public Health. v. 96, 2006 Alta Intermediao(pontos crticos para disseminao)IntermediaoLimitaesMenor caminho no o nico caminho que importaAlternativas: random walk betweenessCusto computacionalProximidadeMede quo prximo est um n em relao a todos os outros ns da rede

Medida de eficincia Uma mensagem originada de uma posio central ir se espalhar por toda rede com um custo mnimo

Medida de independncia Depende de poucos intermedirios, uma vez que pode alcanar facilmente todos os ns da redeProximidadeClculo

O nmero de caminhos geodsicos ligando pi a pk.Somatrio de todos os caminhos geodsicos entre pi e pk Normalizao ocorre pq grafos maiores tero distancias maiores, mas n necessariamente tm menos proximidade.18ProximidadeClculo

Onde n 1 o tamanho da grafo - 1NormalizaoProximidadeLimitaes:Mal definida para redes desconectadasNs adjacentes a um dado n de alta proximidade tambm tero alta proximidadeMas no necessariamente sero ns importantesE.g., Redes de co-autoriaProximidade infinita para redes desconectadas.Redes de co-autoria: Professores com alunos: por estarem diretamento conectados aos prof., os alunos possuem alta proximidade caso os profs o tenha.Escrever artigos...etc20Exemplo de UsoExample: Co-authorship networks (Liu 2008)Grau:Autores que possuem muitos co-autores publicando artigos.Proximidade:Autores que esto diretamente conectados a outros autores bem conectados.Ex: Um estudante supervisionado por um professor prestigiado.Intermediao:Autores que desempenham um papel crucial na ligao de diferentes comunidades.Outras Medidasndice de BonacichAlcancePage Rankndice de Bonacich Centralidade no significa necessariamente poder (Hanneman 1998)Por um lado: Actors who have more ties have greater opportunities because they have choices Por outro lado: the actors that you are connected to are, themselves, well connected, they are not highly dependent on youBonacich defende que quanto mais ligaes tiverem os actores a quem um actor estligado mais central ele . O ndice de centralidade de Bonacich considera que a centralidadede cada actor funo: da quantidade de ligaes que tem o actor; da quantidade de ligaes que tem os actores da sua vizinhana (quanto mais ligaestiverem os actores da vizinhana de A, mais central ser A).Mas ainda, Bonacich considera que quanto menos ligaes tiverem os actores a quemum actor est ligado mais poderoso ele . O ndice de poder de Bonacich considera que opoder de cada actor funo: da quantidade de ligaes que tem o actor; da quantidade de ligaes que tem os actores da sua vizinhana (quanto menos ligaestiverem os actores da sua vizinhana, mais poderoso ser o actor A)23AlcanceAlcance (Reach)Ns de ns alcanados com dois passosSimilar ao grau, mas considera links indiretosPage RankMecanismo de busca googleAnlise de ligaesAtribuio de pesos

Centralidade leva em considerao que ns so mais referenciados

O algoritmo faz a analise das ligacoes existentes entre diversos nos (no caso paginas web)e atribui um peso numerico a cada no conforme o numero de ligacoes oriundas de outrosnos.25CentralizaoMede o quo uma rede centralizada em torno de poucos indivduosExemplo: Freeman centralization (comparao com uma rede em estrela caso extremo de rede centralizada)O que centralizao realmente indica? Que maior poder pode ser exercido sobre os outros?Rich clubs!!!Concluses - Centralidade e PoderCentralidade tem sido vista como uma medida de poderEm que situaes centralidade no poder?Entretanto conceitos devem ser distinguidos:CentralidadePoder Influncia Prestgio Indice de bonacciProximidade aluno de mestradoFazer com que outros dependam dele individuos mais importantes da redePoder:tornar os outros dependentes de voc. quanto mais forem dependentes mais poder voc vai ter.

27Concluses - Centralidade e PoderInfluncia depende no apenas da estrutura da rede mas das interaes ao longo do tempo

Ver Klout Score - http://klout.com/home

Indice de bonacciProximidade aluno de mestradoFazer com que outros dependam dele individuos mais importantes da redePoder:tornar os outros dependentes de voc. quanto mais forem dependentes mais poder voc vai ter.

28Material de EstudoCentrality in Social Networks Conceptual Clarification, by L. Freeman

Centrality and Power (in Introduction to Social Network Methods), by R. Hanneman