Análise de Redes em Mídias Sociais: Começando sem Erros #codabr

Post on 21-Jan-2018

537 views 5 download

Transcript of Análise de Redes em Mídias Sociais: Começando sem Erros #codabr

ANÁLISE DE REDES EM MÍDIAS SOCIAIScomeçando sem erros

Tarcízio Silva

Mestre (UFBA) e doutorando (UMESP) em Comunicação. Diretor de Pesquisa em Comunicação no IBPAD. Experiência anterior em agências digitais, ferramentas de monitoramento e pesquisa aplicada de inovação (Social Figures, Flagcx, Coworkers e outras).

Atendeu a clientes e marcas como Ideia Inteligência, Rede Globo, Petrobras, Grupo Informe, Inter-American Development Bank, Unilever, Sebrae, TCE-PE, Netshoes, Accor Hotels, 99, Discovery e outros.

Professor convidado de especializações (Digicorp-USP, Unisinos, FBB etc) e pesquisador acadêmico com diversas publicações, incluindo a organização de livros como Monitoramento e Pesquisa em Mídias Sociais: metodologias, aplicações e inovações (2016), Para Entender o Monitoramento de Mídias Sociais (2012) e Mídias Sociais: Saberes e Representações (2012).

tarciziosilva.com.br

A ideia de rede é muito útil para pensar

diferentes fenômenos naturais e sociais.

A análise de redes parte do princípio que mais informação pode ser gerada a partir da

compreensão de como os elementos de um conjunto estão ligados entre si.

Redes por todos os lados

Redes por todos os lados

Ecologia

Redes por todos os lados

EcologiaTransportes

Redes por todos os lados

EcologiaTransportes

Personagens

Redes por todos os lados

EcologiaTransportes

Personagens

Produtos Culturais

Redes por todos os lados

EcologiaTransportes

Personagens

Produtos Culturais

Ingredientes

Redes por todos os lados

EcologiaTransportes

Personagens

Produtos Culturais

Ingredientes

Relações Sexuais

Redes por todos os lados

EcologiaTransportes

Personagens

Produtos Culturais

Ingredientes

Relações SexuaisJogos de Futebol

Por que visualizar redes?

Descobrir e idear tipos de relações entre indivíduos, objetos e coisas

Descobrir grupos e suas interações

Identificar nós engajados em trocas e fluxos de informação e valores

Identificar nós de influência na rede na emissão oucirculação de informação

Investigar fenômenos de interferência “estratégica” ounociva na rede

Redes como fatos públicos / noticiáveis

http://www.nytimes.com/2008/04/06/world/middleeast/06iranblog.html

Redes como fatos públicos / noticiáveis

https://www.revistaforum.com.br/2013/06/17/mapeamento

Do que é composta uma rede?

• Nós: elementos individualizáveis que podem se conectar direta ouindiretamente a outros.

Exemplos: pessoas, animais, websites, aeroportos, personagens, palavras, ingredientes, estações, livros, perfis, hashtags

Nó / Vértice Nó / Vértice

Do que é composta uma rede?

• Nós: elementos individualizáveis que podem se conectar direta ouindiretamente a outros.

Exemplos: pessoas, animais, websites, aeroportos, personagens, palavras, ingredientes, estações, livros, perfis, hashtags

• Arestas: conexões entre os nós da rede. Materiais ou imateriais; explícitas ouimplícitas; intencionais ou observadas.

Exemplos: relação predatória, vôos, amizade, parentesco, relações sexuais, hyperlink, retweet, co-ocorrência, proximidade

Nó / Vértice Nó / Vértice

Laço / Aresta

É difícil montar uma rede?

Lista de Arestas (Relações)

É difícil montar uma rede?

Lista de Arestas (Relações)

Planejando usar redes de mídias sociais

Como usar redes de mídias sociais em uma reportagem ou artigo?

1. Definir problema de investigação

2. Organizar a coleta de dados

3. Interpretar os resultados

4. Visualizar e apresentar

Por que visualizar redes?

Descobrir e idear tipos de relações entre indivíduos, objetos e coisas

Descobrir grupos e suas interações

Identificar nós engajados em trocas e fluxos de informação e valores

Identificar nós de influência na rede na emissãoou circulação de informação

Investigar fenômenos de interferência“estratégica” ou nociva na rede

Por que visualizar redes em mídias sociais?

Descobrir relações entre perfis, indivíduos e grupos

Mapear comunidades de interesse, afiliação e trocaonline

Identificar ativadores, agitadores ou “engajados” emtemas

Analisar públicos de mídia, entidades ou empresas

Identificar influenciadores em temas oucontrovérsias públicas

Investigar fenômenos como bots, fakes e ciborgues

1. Definir problema de investigação

Quero identificar uma movimentação online sobreum tema relevante?Ex: Aylan Kurdi

http://visualsocialmedialab.org/projects/the-iconic-image-on-social-media

1. Definir problema de investigação

Foto do menino Aylan Kurdi publicada por jornalista Michelle Demishevich - 33 retweets em uma hora

1. Definir problema de investigação

664 retweets na segunda hora, com o papel de Diretor da Human Rights Watch

1. Definir problema de investigação

Fase Global: jornalista da Washington Post gera 7421 retweets

1. Definir problema de investigação

Mainstream: mais de 500 reportagens em veículos do mundo todo, incluindo EUA e Reino Unido - 20 mil tweets/hora

1. Definir problema de investigação

Quero identificar uma movimentação online sobreum tema relevante?Ex: Aylan Kurdi

Quero gerar debate sobre influência em um grupo?Ex: Rede de Parlamentares no Facebook

http://blogs.oglobo.globo.com/na-base-dos-dados/post/quem-sao-os-politicos-que-lideram-nas-midias-sociais.html

1. Definir problema de investigação

Quero gerar debate sobre influência em um grupo?Ex: Rede de Parlamentares no Facebook

http://blogs.oglobo.globo.com/na-base-dos-dados/post/quem-sao-os-politicos-que-lideram-nas-midias-sociais.html

1. Definir problema de investigação

Quero identificar uma movimentação online sobreum tema relevante?Ex: Aylan Kurdi

Quero gerar debate sobre influência em um grupo?Ex: Rede de Parlamentares no Facebook

Quero mapear um macro-tema e motivações de usuários?Ex: Debate sobre Direitos das Mulheres

https://publications.iadb.org/handle/11319/8501

1. Definir problema de investigação

Quero mapear um macro-tema e motivações de usuários?Ex: Debate sobre Direitos das Mulheres

https://publications.iadb.org/handle/11319/8501

1. Definir problema de investigação

Quero identificar uma movimentação online sobreum tema relevante?Ex: Aylan Kurdi

Quero gerar debate sobre influência em um grupo?Ex: Rede de Parlamentares no Facebook

Quero mapear um macro-tema e motivações de usuários?Ex: Debate sobre Direitos das Mulheres

Quero observar mudança de foco nas controvérsiaspolíticas online?Ex: Polaridade Política

1. Definir problema de investigação

Quero observar mudança de foco nas controvérsiaspolíticas online?Ex: Polaridade Política

Brazil’s electorate: still polarised but in a new way, reportagem na Financial Times (Fevereiro de 2015)http://on.ft.com/1D9lB03

Brazil’s election: as polarized as can be (Novembro de 2014) http://on.ft.com/1Shyf3x

erro comum: se preocupar com dados tarde demais

A coleta de dados deve ser iniciada o maisrápido possível

Coleta retroativa pode ser cara, complexa ouimpossível

Levar em conta a exclusão de publicações

Coleta continua de territórios relevantes para o jornalista/pesquisador

“Tô preparando reportagem sobre

os acontecimentos da semana

passada e preciso de dados”.

“Estou chegando na qualificação e

preciso coletar dados das jornadas

de junho de 2013... Como eu os

consigo?”

2. Organizando a coleta de dados

Mas como coletar dados nas mídias sociais?

2. Organizando a coleta de dados

Mas como coletar dados nas mídias sociais?

Identificar quais são os elementos das redes, seus nós e relações possíveis e o que significam

em cada contexto

2. Organizando a coleta de dados

Mas como coletar dados nas mídias sociais?

Identificar quais são os elementos das redes, seus nós e relações possíveis e o que significam

em cada contexto

Pragmaticamente, aprender e valiar o que é possível de ser coletado nas plataformas com

as ferramentas disponíveis

Nós e arestas comuns nas mídias sociais

NÓS

CONEXÕES

PerfisHashtags

MentionsRT

SeguirCo-ocorrência

PerfisHashtags

Co-HashtagSeguir

PerfisPáginas

LikesCo-Comentários

Tagging

Amizades

BlogsSites

Links

CanaisUsuários

InscriçãoCo-comentários

2. Organizando a coleta de dados

Monitoramento de publicações

Extração / Scraping de Relações

2. Organizando a coleta de dados

Monitoramento de publicaçõesColeta de conteúdo publicado por usuários, geralmente sobre determinados temas, como controvérsias, eventos, políticos etc.

Exemplos:• monitoramento de tweets sobre determinado tema• monitoramento de hashtagspublicadas em uma região

Extração / Scraping de Relações

2. Organizando a coleta de dados

Monitoramento de publicaçõesColeta de conteúdo publicado por usuários, geralmente sobre determinados temas, como controvérsias, eventos, políticos etc.

Exemplos:• monitoramento de tweets sobre determinado tema• monitoramento de hashtagspublicadas em uma região

Extração / Scraping de RelaçõesExtração ou raspagem de relações mais permanentes, que possam indicar redes de apoio, afiliações ou influência.

Exemplos:• relações de likes entre páginas de um grupo de interesse• hyperlinks entre sidebars de blogs políticos

2. Organizando a coleta de dados

Monitoramento de publicações• Definição de temas e ambientes• Construção de queries de busca

(no Twitter, busca booleana)• Configuração de ferramenta• Tratamento da coleta• Análise e interpretação

Tema:Minha Ciência em um Tweet

Queries:#MinhaCienciaEmUmTweet OR “minha ciência em um tweet”

Ciência AND (Brasil OR twitter OR pesquisa)Universidades AND (Brasil OR Twitter OR pesquisa)

2. Organizando a coleta de dados

https://netlytic.org

2. Organizando a coleta de dados

https://netlytic.org

2. Organizando a coleta de dados

https://netlytic.org

Nó / Vértice Nó / Vértice

Laço / Aresta

07CleaMe DrJorgeMelendez

Retweet

2. Organizando a coleta de dados

Monitoramento de publicaçõesColeta de conteúdo publicado por usuários, geralmente sobre determinados temas, como controvérsias, eventos, políticos etc.

Exemplos:• monitoramento de tweets sobre determinado tema• monitoramento de hashtagspublicadas em uma região

Extração / Scraping de RelaçõesExtração ou raspagem de relações mais permanentes, que possam indicar redes de apoio, afiliações ou influência.

Exemplos:• relações de likes entre páginas de um grupo de interesse• hyperlinks entre sidebars de blogs políticos

2. Organizando a coleta de dados

Extração/Scraping de relações• Definição de temas e escopo• Levantamento de sites/páginas seed• Snowball sampling

2. Organizando a coleta de dados

Ferramentas

Coleta + Visualização

COSMOS

twitteRRfacebookThinkToStartR

Ferramentas

Coleta de Dados

Coleta + Visualização

Naoyun

COSMOS

twitteRRfacebookThinkToStartR

Ferramentas

Coleta de Dados

Coleta + VisualizaçãoVisualização / Processamento

Naoyun

igraph

COSMOS

twitteRRfacebookThinkToStartR

Ferramentas

Coleta de Dados

Coleta + VisualizaçãoVisualização / Processamento

Social ListeningNaoyun

igraph

COSMOS

Métricas de Redes

Grau de Centralidade: contabiliza o número de conexões totais; conexões enviadas (Saída) ou recebidas (Entrada)

Centralidade Autovetor: uma medida que analisa não só a quantidade de conexões recebidas por um nó, mas se estas conexões são feitas por outros nós também conectados. Pode ser utilizado para medir a influência, em alguns casos.

Intermediação: a métrica de intermediação permite calcular quantas vezes um nó está presente entre os menores caminhos possíveis entre dois nós da mesma rede. Pode representar a possibilidade um nós ser um “intermediário”, como o nome diz, na circulação de algum dado ou informação na rede, por exemplo.

Métricas de Redes

Grau de Centralidade: contabiliza o número de conexões totais; conexões enviadas (Saída) ou recebidas (Entrada)

Grau 6Grau de Entrada 4Grau de Saíde 2

Grau 5Grau de Entrada 2Grau de Saída 3

Métricas de Redes

Grau de Centralidade:Grau de Entrada Grau de Saída

scienceblogsbr 133

nilmoretto 117

moiraleao 99

erickjr_silva 94

jessica7duarte 95

patrickkalt 87

foliveira_astro 83

franciscoicmc 76

iaravps 56

iserrapilheira 58

scienceblogsbr 49

paulusantana 43

rafazenni 37

lyzbeltrame 30

licunhag 29

aguilaniulab 26

minasfazciencia 21

homem100medo 20

lucas_maxado_ 19

carloshotta 17

Métricas de Redes

Centralidade Autovetor: uma medida que analisa não só a quantidade de conexões recebidas por um nó, mas se estas conexões são feitas por outros nós também conectados. Pode ser utilizado para medir a influência, em alguns casos.

O algoritmo PageRank, utilizado por Larry Page para o rankeamentono Google, é um exemplo do tipo.

Simplificação da lógica do PageRank

Métricas de Redes

Intermediação: a métrica de intermediação permite calcular quantas vezes um nó está presente entre os menores caminhos possíveis entre dois nós da mesma rede. Pode representar a possibilidade um nós ser um “intermediário”, como o nome diz, na circulação de algum dado ou informação na rede, por exemplo.

A Definition, Meta-Methology, & Practical Purpose for Evaluation http://bit.ly/1VNGDqP

A: maior IntermediaçãoB: maior Grau

Métricas de Redes

Densidade: a métrica de densidade mede o quão próxima de estar totalmente conectada uma rede está. Uma rede contendo todas as conexões possíveis entre todos os nós teria densidade 1.

Rede com 50 nós e 374 arestas, densidade

0.305Rede com 50 nós e 712 arestas,

densidade 0.581

3. Interpretar os resultados

Pontos de foco

Controvérsias e posições

Disrupções e conflitos

Reapropriações

Atores x Grupos

Densidade

Centros e Periferia

Clusters / Comunidades

Agrupamentos identificados através da conexão entre perfis.

Clusters são grupos de perfis mais conectados entre si do que em relação à rede como um todo.

Quando são clusters de pessoas, podem indicar comunidades de pessoas que interagem entre si com frequência.

Austráliahttps://pt.slideshare.net/Snurb/exploring-emotions-on-auspol-polarity-and-public-performance-in-the-twitter-debate-on-australian-politics

Estados Unidoshttp://cs.wellesley.edu/~pmetaxas/Research/coRT-Political-Polarization.pdf

Brasilhttps://www.digitalrightslac.net/pt/polarizacion-y-resaca-electoral-en-brasil

https://publications.iadb.org/handle/11319/8501

http://cmsimpact.org/resource/beyond-hashtags-ferguson-blacklivesmatter-online-struggle-offline-justice

erro: mostrar parte da rede

Mostrar apenas parte da rede pode levar a interpretações errôneas.

Em 2014 vazou documento de escritório de advocacia acusando ação estratégica de tuiteiroscontra candidato.

http://ibidem.org.br/aecio-neves-aciona-judicialmente-o-twitter-para-que-dados-de-66-usuarios-sejam-revelados

Limites das redes

REDES EGO-CENTRADAS REDES SOCIO-CENTRADAS REDES DE SISTEMAS ABERTOS

Limites das redes

REDES EGO-CENTRADAS

Redes construídas em torno de umponto de partida e suas conexões.

Exemplo: rede de seguidores noTwitter de um canal; rede direta delikes de uma página do Facebook.

REDES SOCIO-CENTRADAS REDES DE SISTEMAS ABERTOS

Rede-ego 1.5 de uma única página de Facebook

Limites das redes

REDES EGO-CENTRADAS

Redes construídas em torno de umponto de partida e suas conexões.

Exemplo: rede de seguidores noTwitter de um canal; rede direta delikes de uma página do Facebook.

REDES SOCIO-CENTRADAS

Redes dentro de um “limite” definido,com número total de nós conhecido.

No caso das mídias sociais: rede deinterações dentro de um grupo doFacebook.

REDES DE SISTEMAS ABERTOS

Rede-ego 1.5 de uma única página de Facebook

Rede de co-comentários entre usuários dentro de uma única página de Facebook

Limites das redes

REDES EGO-CENTRADAS

Redes construídas em torno de umponto de partida e suas conexões.

Exemplo: rede de seguidores noTwitter de um canal; rede direta delikes de uma página do Facebook.

REDES SOCIO-CENTRADAS

Redes dentro de um “limite” definido,com número total de nós conhecido.

No caso das mídias sociais: rede deinterações dentro de um grupo doFacebook.

REDES DE SISTEMAS ABERTOS

Redes nas quais os limites não sãoclaramente definidos ou conhecidos.

Exemplo nas mídias sociais:influenciadores sobre um determinadosegmento, a partir de monitoramento dekeywords.

Rede-ego 1.5 de uma única página de Facebook

Rede de co-comentários entre usuários dentro de uma única página de Facebook

Rede baseada nas interações sobre a keywords employment AND #SDG durante evento

erro comum: usar métricas inadequadas

Compreender as métricas adequadas para o fenômeno observado

Centralidade no debate?Intermediação de informação?Engajamento ou Impacto?

Softwares com visualização gráfica online tendem a limitar a customização de métricase layouts

Seguir para softwares mais potentes para processamento e visualização (Gephi)

4. Visualizar e apresentar

Clareza sobre a coleta e limites dos dados

Padrões sobre variáveis:• Tamanho dos nós: variáveis quantitativas como

centralidade, intermediação, autovetor• Geralmente variáveis nominais são visualizadas

com cores, como módulos/comunidades ou origem geográfica

Compartilhamento de datasets completo dificultado por ToS

Visualizações interativas como sigmajs

http://www.ibpad.com.br/redes/direita-esquerda

http://www.ibpad.com.br/redes/primeiroassedio

http://www.ibpad.com.br/redes/instagrambr

O livro Monitoramento e Pesquisa em Mídias Sociais: metodologias, aplicações e inovações reúne colaborações de uma rede de profissionais e pesquisadores que atuam em universidades, empresas e agências. Temas basilares, mas ainda controvertidos, como análise de sentimento, atendimento ao consumidor ou etnografia somam-se a aplicações e inovações que vão de reconhecimento de imagem a estudos sobre memes, compondo contribuição sólida ao campo.

IBPAD

bit.ly/livroibpad

redesEcologia http://www.oupcanada.com/catalog/9780195188165.html

Personagens http://moviegalaxies.com

Livros https://www.facebook.com/notes/facebook-data-science/books-

that-have-stayed-with-us/10152511240328859/

Ingredientes http://www.ladamic.com/wordpress/?p=294

Rede de Relações Sexuais http://bit.ly/1gmRsQs

Futebol http://bit.ly/2hTIrkp

Insights from Social Media on Gender in Latin America

https://publications.iadb.org/handle/11319/8501#sthash.xyoBuDPv.dp

uf

Leia e Estude +

Iniciação a Redes - NetSciEd

Livro Monitoramento e Pesquisa em Mídias Sociais

Curso ONLINE gratuito de Netlytic

ferramentasChorus http://chorusanalytics.co.uk

Cosmos http://socialdatalab.net/software

Flocker flocker.outliers.es

Gephi https://gephi.org

Igraph igraph.org

Issuecrawler http://issuecrawler.com

Netlytic netlytic.org

Netvizz https://apps.facebook.com/netvizz

NodeXL https://nodexl.codeplex.com

Naoyun http://matthieu-

totet.fr/Koumin/tools/naoyun

Onodo https://onodo.org

Polinode https://polinode.com

Pajek http://mrvar.fdv.uni-lj.si/pajek

SNAP http://snap.stanford.edu/snap/

VOSON http://uberlink.com/services/voson

UCINET

sites.google.com/site/ucinetsoftware/home