Medidas de Centralidade

10
Medidas de Centralidade No âmbito da teoria dos grafos e da análise de redes, existem diferentes tipos de medidas de centralidade de um vértice num grafo que determinam a importância relativa de um vértice no grafo (isto é, o quanto uma pessoa é influente dentro de uma rede social, ou, na teoria da sintaxe espacial, o quanto é importante uma sala dentro de um edifício ou como é bem utilizada uma estrada dentro de uma rede urbana). Muitos dos conceitos de centralidade foram primeiramente desenvolvidos na análise de redes sociais, e muitos dos termos usados para medir a centralidade refletem a sua origem sociológica. Existem quatro medidas de centralidade que são amplamente utilizados na análise de rede: centralidade de grau, centralidade de intermediação, centralidade de proximidade e centralidade de vetor próprio. Centralidade de Grau Historicamente primeira, a centralidade de grau é conceptualmente a mais simples, a qual é definida como o número de ligações incidentes sobre um nó (por exemplo, o número de ligações que um nó possuí). O grau pode ser interpretado em termos de risco imediato de um nó para capturar tudo o que circula através da rede (por exemplo, um vírus, ou alguma informação) Centralidade de Proximidade Em grafos conectados existe uma distância natural métrica entre todos os pares de nós, definido pelo comprimento de seus caminhos mais curtos. O afastamento de um nó s é definido como a soma de suas distâncias para todos os outros nós, e sua proximidade é definida como o inverso do afastamento. Assim, quanto mais central é o nó, menor é a distância do seu total para todos os outros nós. Proximidade pode ser considerada como uma medida de rapidez, para determinar a velocidade que ela necessitará para difundir informações de s a todos os outros nós sequencialmente. Centralidade de Intermediacao

Transcript of Medidas de Centralidade

Page 1: Medidas de Centralidade

Medidas de Centralidade

No âmbito da teoria dos grafos e da análise de redes, existem diferentes tipos

de medidas de centralidade de um vértice num grafo que determinam a

importância relativa de um vértice no grafo (isto é, o quanto uma pessoa é

influente dentro de uma rede social, ou, na teoria da sintaxe espacial, o quanto

é importante uma sala dentro de um edifício ou como é bem utilizada uma

estrada dentro de uma rede urbana). Muitos dos conceitos de centralidade

foram primeiramente desenvolvidos na análise de redes sociais, e muitos dos

termos usados para medir a centralidade refletem a sua origem sociológica.

Existem quatro medidas de centralidade que são amplamente utilizados na

análise de rede: centralidade de grau, centralidade de intermediação,

centralidade de proximidade e centralidade de vetor próprio.

Centralidade de Grau

Historicamente primeira, a centralidade de grau é conceptualmente a mais

simples, a qual é definida como o número de ligações incidentes sobre um nó

(por exemplo, o número de ligações que um nó possuí). O grau pode ser

interpretado em termos de risco imediato de um nó para capturar tudo o que

circula através da rede (por exemplo, um vírus, ou alguma informação) 

Centralidade de Proximidade

Em grafos conectados existe uma distância natural métrica entre todos os

pares de nós, definido pelo comprimento de seus caminhos mais curtos. O

afastamento de um nó s é definido como a soma de suas distâncias para todos

os outros nós, e sua proximidade é definida como o inverso do afastamento.

Assim, quanto mais central é o nó, menor é a distância do seu total para todos

os outros nós. Proximidade pode ser considerada como uma medida de

rapidez, para determinar a velocidade que ela necessitará para difundir

informações de s a todos os outros nós sequencialmente.

Centralidade de Intermediacao

É uma medida de centralidade de um vértice dentro de um grafo (existe

também a intermediação das arestas, que não é discutido aqui). Centralidade

de intermediação quantifica o número de vezes que um nó age como ponte ao

longo do caminho mais curto entre dois outros nós. Foi introduzido por Linton

Freeman. como uma medida para quantificar o controlo de um ser humano

sobre a comunicação entre outros seres humanos numa rede social. Na sua

conceção, vértices que possuem uma alta probabilidade de ocorrer num

caminho mais curto escolhido aleatoriamente entre dois vértices também

escolhidos aleatoriamente que possuam uma elevada intermediação.

Centralidade de Vetor Proprio

Page 2: Medidas de Centralidade

Centralidade de vetor próprio é uma medida da influência de um nó numa rede.

Ele atribui pontuações relativas a todos os nós da rede, baseada no conceito

de que as ligações para os nós de alta pontuação contribuem mais para a

pontuação do nó em questão do que ligações iguais a nós baixa pontuação. O

sistema de PageRank do Google é uma variante da medida de centralidade de

vetor próprio.

Centalizacao

A centralização de qualquer rede é uma medida de quão central é o nó mais

central, em relação à forma de quão central serão todos os outros nós. A

definição geral de centralização para redes não ponderadas foi proposta por

Linton Freeman (1979). Centralização mede então: (a) Calcular a soma de

diferenças na centralidade entre o nó mais central de uma rede, e todos os

outros nós; (b) Dividir esta quantidade pela teoricamente maior soma das

diferenças em toda a rede do mesmo grau. Assim, a cada medida de

centralidade pode ter a sua própria medida de centralização. Definidos

formalmente, se   é uma medida de ponto central qualquer  , se   

é a maior medida na rede, e se   é a maior soma

das diferenças do ponto central   para qualquer grafo com o mesmo número

de nós, em seguida, a centralização da rede é :

Page 3: Medidas de Centralidade

Medidas de Forma: Assimetria e Curtose

Simetria

Seguindo a definição de uma função simétrica, pode-se dizer que a distribuição de probabilidade da variável aleatória y com espaço amostral Sy é simétrica em torno damédia μy se:

fy(μy-w)=fy(μy+w)   para todo w∈Sy

Em relação à simetria das distribuições pode-se considerar que:

Numa distribuição simétrica em torno de μy, o seu gráfico à esquerda da média é um espelho do gráfico à direita, indicando que a forma como os valores se distribuem à esquerda da média é a mesma à direita. Os desvios positivos e negativos tem a mesma preponderância e as caudas da distribuição possuem o mesmo formato. Nesse caso, o terceiro momento centrado é nulo, ou seja, μ3=E(y-μy)3=0. É importante salientar que se ocorre simetria então μ3=0 mas a recíproca não é sempre verdadeira, ou seja, existe distribuição assimétrica onde μ3=0. Outro aspecto importante nas distribuições unimodais simétricas é que média, mediana emoda tem o mesmo valor.

Numa distribuição assimétrica positiva, os desvios positivos são preponderantes em relação aos negativos. Nesse caso, a cauda à direita é mais alongada que a cauda à esquerda e μ3>0. A média, puxada pela cauda maior à direita, é maior que a mediana que, por sua vez, é maior que a moda.

Numa distribuição assimétrica negativa os desvios negativos são preponderantes em relação aos positivos. Nesse caso, a cauda à esquerda é mais alongada que a cauda à direita e μ3<0. A média, puxada pela cauda maior à esquerda, é menor que a mediana que, por sua vez, é menor que a moda.

As figuras que seguem ilustram distribuições simétricas acima e abaixo uma assimétrica negativa à esquerda e uma assimétrica positiva à direita.

Page 4: Medidas de Centralidade

    

Embora as ilustrações utilizem distribuições contínuas, a ideia é a mesma no caso das distribuições discretas.

Como se pode observar, o terceiro momento centrado depende da unidade de medida de y, o que dificulta a comparação de diferentes distribuições quanto ao grau de assimetria. Para contornar esse problema, a medida de assimetria mais utilizada é o coeficiente de assimetria, definida por:

γ1=μ3μ2μ2=μ3σy3 

sendo σy o desvio padrão de y.

Essa medida não se modifica se y for multiplicada por uma constante e, em particular, independe da unidade de medida de y. Não há limitação para o seu valor e, sendo composta por desvios elevados ao cubo, pode ser muito afetada por valores atípicos. É evidente, portanto, que γ1=0 indica distribuição simétrica, γ1<0 indica distribuição assimétrica negativa e γ1>0 indica distribuição assimétrica positiva.

Curtose 

Outra medida usualmente utilizada para caracterizar uma distribuição é a curtose, nome dado ao grau de achatamento da distribuição, frequentemente estabelecida em relação à distribuição normal.

O coeficiente de curtose, medida utilizada para classificar a distribuição quanto à curtose, é definido por:

γ2=μ4μ22-3=μ4σy4-3 

Esse coeficiente, também denominado de excesso de curtose, varia entre -2 e +∞, não é afetado por unidades de medida e, sendo composto de desvios na quarta potência, valores atípicos de y podem influenciá-lo demasiadamente.

A figura que segue mostra uma distribuição normal com parâmetros média 0 e desvio padrão σ. A distribuição normal possui γ2=0 e é utilizada como referência para interpretação do coeficiente de curtose.

Page 5: Medidas de Centralidade

A interpretação do coeficiente de curtose deve sempre ser feita com cuidado, mas de uma forma geral pode ser considerada em termos da concentração de valores ao redor de μy±σy:

Se a concentração ao redor de μy±σy for a mesma da distribuição normal, a distribuição é denominada mesocúrtica e deverá ter γ2=0.

Uma distribuição é classificada como platicúrtica se tiver γ2<0 e deverá ter como características:

Concentração de valores ao redor de μy±σy é maior que a da normal.

Pico é mais arredondado com caudas mais curtas e mais magras.

Menor probabilidade que a normal de ter valores próximos à média.

Menor probabilidade que a normal de ter valores extremos.

Uma distribuição é classificada como leptocúrtica se tiver γ2>0 e deverá ter como características:

Concentração de valores ao redor de μy±σy é menor que a da normal.

Pico é mais agudo com caudas mais longas e mais pesadas.

Maior probabilidade que a normal de ter valores próximos à média.

Maior probabilidade que a normal de ter valores extremos.

A figura que segue ilustra um conjunto de distribuições todas simétricas mas com curtoses distintas.

Page 6: Medidas de Centralidade

 

As distribuições e respectivos coeficientes de curtose são:

curtose 3, distribuição (D)upla exponencial de Laplace;

curtose 2, distribuição (S)ecante hiperbólica;

curtose 1.2, distribuição (L)ogística;

curtose 0, distribuição (N)ormal;

curtose −0.593762…, distribuição (C)osseno;

curtose −1, distribuição semicírculo de (W)igner;

curtose −1.2, distribuição (U)niforme.

Como se pode perceber, a interpretação da curtose não é muito simples. O maior ou menor pico, como usualmente é interpretada, não é o aspecto mais importante e sim a concentração de valores nas caudas. A figura que ilustra a simetria da distribuição normal no início deste tópico, mostra uma situação onde o coeficiente de curtose é zero para as duas distribuições, embora o gráfico pareça indicar que uma tem pico maior que outra. Ambas tem a mesma concentração de valores em torno de μy±σy. Na distribuição normal o coeficiente de curtose independe dos parâmetros.

Page 7: Medidas de Centralidade

IÊDA LUIZA DOS SANTOS

Medidas de Centralidade

Medidas de Forma: Assimetria e Curtose

Valença- BA, 2014

Page 8: Medidas de Centralidade

IÊDA LUIZA DOS SANTOS

Medidas de Centralidade

Medidas de Forma: Assimetria e Curtose

Valença-BA, 2014

Atividade avaliativa elaborada para a disciplina de Estatistica Empresarial, curso Ciências Contabéis.