ANAIS_SBSC_2011

download ANAIS_SBSC_2011

of 243

Transcript of ANAIS_SBSC_2011

ANAIS VIII SIMPSIO BRASILEIRO DE SISTEMAS COLABORATIVOS 5 a 7 de Outubro de 2011 PARATY, RJ ANAIS Coordenao GeralMarcos Roberto da Silva Borges (IM-UFRJ) Coordenao do Comit de Programa Ana Cristina Bicharra Garcia (UFF) Pedro Antunes (Universidade Tcnica de Lisboa) Realizao Universidade Federal do Rio de Janeiro (UFRJ) Universidade Federal Fluminense (UFF) Promoo SBC Sociedade Brasileira de Computao ISBN 978-85-7669-254-6 VIII Simpsio Brasileiro de Sistemas Colaborativos- I - S U M R I OPrefcio...........................................................................................................VII Organizao SBSC 2011................................................................................... IX Palestras Convidadas .........................................................................................XI Sesso 1: Interao Social 1.1. Entendendo a Twitteresfera Brasileira.......................................................01 FABRCIO BENEVENUTO, DIEGO SILVEIRA, THALISSON OLIVEIRA, LEONARDO BOMBONATO, REINALDO FORTES E LVARO PEREIRA JR. 1.2. Uma investigao sobre os "Assuntos do Momento" e a Discusso de Notcias no Servio de Microblogging ...................................... 09 KAREN FIGUEIREDO E ANA CRISTINA GARCIA 1.3. Social networks and collective intelligence applied to public transportation systems: A survey...................................................... 16 ANA PAULA CHAVES, IGOR STEINMACHER E VANINHA VIEIRA 1.4. Multides: a nova onda do CSCW?............................................................ 24 DANIEL SCHNEIDER, JANO M. DE SOUZA E KATIA MORAES Sesso 2: Inteligncia Coletiva2.1. Um modelo para o suporte computacional da inteligncia coletiva na Web............................................................................ 33 STRAUS MICHALSKY E MARCO AURLIO GEROSA 2.2. Predio de falhas em projetos de software baseado em mtricas de redes sociais de comunicao e cooperao............................... 37 VIDAL FONTOURA, IGOR STEINMACHER, IGOR WIESE E MARCO AURLIO GEROSA 2.3. Um aplicativo baseado em inteligncia coletiva para compartilhamento de rotas em redes sociais ..................................................... 41 LUIZ PHILIPE SERRANO ALVES, ANA PAULA CHAVES E IGOR STEINMACHER - III -Sesso 3: Colaborao em Micromundos e Atravs de Dispositivos Mveis3.1. Using Microworlds to Study Teamwork at the Cognitive Level..............................................................................................46 CLAUDIO SAPATEIRO, ANTONIO FERREIRA E PEDRO ANTUNES 3.2. SLMeetingRoom: Um Modelo de Ambiente para Suporte a Reunies Remotas, Orientadas a Tarefas, com Grupos Pequenos para o Second Life .........................................................54 CINTIA CAETANO E ANA CRISTINA GARCIA 3.3. xAgent: Arquitetura para a Colaborao em Ambientes Cross-Reality................................................................................62 DBORA CARDADOR, KATIA VEGA, HUGO FUKS E CARLOS LUCENA 3.4. Ampliando o suporte interoperabilidade em uma arquitetura orientada a servios de middleware para sistemas colaborativos ...................................................................................68 RITA SUZANA MACIEL, JOS MARIA DAVID E THIAGO R. DE ALMEIDA 3.5. Uma Ferramenta de Colaborao Mvel para Auxiliar a Interao em Palestras Presenciais.................................................76 GABRIEL BALESTRIN, CARLA BERKENBROCK E CELSO HIRATA Sesso 4: Ferramentas e Desenvolvimento de Sistemas Colaborativos 4.1. Adicionando informaes de contexto de tarefa a uma ferramenta de chat sncrono para apoiar o desenvolvimento distribudo de software........................................................ 84 ANA PAULA CHAVES, IGOR SCALIANTE WIESE, IGOR STEINMACHER, FABIO BAIA, EDILSON F. DA COSTA, KAREN MORESCHI, CICERO JUPI, MARCO AURLIO GEROSA 4.2. Desenvolvimento e Implantao de uma Ferramenta de Apoio a Reunies Presenciais.................................................................... 88 DANIEL BISCALCHIN E JACQUES WAINER 4.3. Ambientes eParticipativos sob a tica do modelo 3C de colaborao........................................................................................ 92 CLEYTON SLAVIERO, ANA CRISTINA GARCIA E CRISTIANO MACIEL Sesso 5: Recomendao5.1. Creating a Blog Recommendation System Through a Framework for Building Blog Crawlers......................................................... 97 RAFAEL FERREIRA LEITE, JEAN MELO, PATRICK BRITO, EVANDRO COSTA, RINALDO LIMA E FRED FREITAS VIII Simpsio Brasileiro de Sistemas Colaborativos- IV -5.2. How to Know What Do You Want? A Survey of Recommender Systems and the Next Generation ............................................104 ANGELINA ZIESEMER E JOO OLIVEIRA 5.3. Ativistas, passageiros, ocasionais e especialistas: perfis de usurio na construo de um site de Q&A........................................112 ADABRIAND FURTADO E NAZARENO ANDRADE 5.4 Content Recommendation Based on Data Mining in Adaptive Educational Social Networks.......................................................120 MARCEL CARACIOLO 5.5. Social Tag Collaborative Recommendation: Mining the Meaning.....................................................................................124 ANGELINA ZIESEMER E JOO OLIVEIRA 5.6. Proposta de Uso de Modelos de Objetivos na Engenharia de Requisitos de Sistemas Colaborativos ......................................128 MARIANA MAIA, CARLA SILVA E STEPHANY VITORIO Sesso 6: Disseminao de Conhecimento 6.1. Sensemaking na Passagem de Servio em Centros de Terapia Intensiva .....................................................................................132 JIVAGO MEDEIROS, RODRIGO DE ANDRADE E ANA CRISTINA GARCIA 6.2. Gesto de contexto no levantamento colaborativo de processos de negcio...............................................................................139 DOUGLAS SILVA, RENATA ARAUJO E FLAVIA SANTORO.6.3. MEK: Uma abordagem oportunstica para disseminao colaborativa do conhecimento.......................................................................145 DIEGO S. SOUZA, GUILHERME FOGAA, PEDRO C. SILVEIRA, JONICE OLIVEIRA E JANO M. DE SOUZA 6.4. Co-designing Collaborative Museums: Combining Ethnography and Co-creation Workshops.......................................................152 HELOISA MOURA, DBORA CARDADOR, KATIA CNEPA, WALLACE UGULINO, MARCOS BARBATO E HUGO FUKS Sesso 7: Sistemas Colaborativos Aplicados a Domnio 7.1. Remember Storytelling API: Um Framework Para o Apoio a Recuperao de Histrias em Group Storytelling................................161 BRUNO COSTA E RAFAEL ALVES 7.2. Aplicao da Abordagem Colaborativa em Herbrios Virtuais.......................................................................................165 LUS ALEXANDRE ESTEVO DA SILVA, KLETO MICHEL ZAN, EDUARDO COUTO DALCIN, DJALMA ALVES DE LIMA, MARCO ANICETO VAZ, FILIPE BRAIDA DO CARMO, GERALDO ZIMBRO E JANO M. DE SOUZA VIII Simpsio Brasileiro de Sistemas Colaborativos- V -7.3. Supporting Group Exposure Therapy......................................................169 LUIS CARRIO, LUS DUARTE, RICARDO PEREIRA, MARCO DE S, JOO FARIA, ISABEL S, GUSTAVO ZURITA E NELSON BALOAIN 7.4 Evoluo dos Sistemas de Comunicao...................................................173 LEANDRO CALVO, MARIANO PIMENTEL E HUGO FUKS Workshop de Teses & Dissertaes 8.1. Modelo de plataforma conectivista para apoio a aprendizagem socializada e colaborativa........................................................178 LUCIANE DEUS, CARLA VERNICA MARQUES, CLAUDIA MOTTA, CARLO EMMANOEL OVEIRA8.2. Evoluo dos Sistemas de Comunicao..................................................184 LEANDRO CALVO, MARIANO PIMENTEL E HUGO FUKS 8.3. Um processo MDA para Linha de Produtos paraSistemas Colaborativos ................................................................................190 CRISTIANA BISPO, JOS MARIA DAVID, RITA SUZANA MACIEL 8.4. Apoiando a reputao em programao em par distribuda .............................................................................................196 DAVI CSAR NASCIMENTO, JOS MARIA DAVID 8.5. Clculo de Reputao em Redes Sociais..................................................202 EDITH ZAIDA SONCO MAMANI, MARCO AURLIO GEROSA 8.6. Visualizaes para percepo em modelos polticos de discusso..................................................................................208 RAFAEL TAVARES, MARIANO PIMENTEL, RENATA ARAUJO 8.7. SmartMovie: Soluo Colaborativa de edio e.........................................214 compartilhamento de vdeo no SBTVD EDUARDO DA SILVA, ROBERTA GOMES, RENATA S.S. GUIZZARDI 8.8. Colaborao Baseada em Cenrios: Contribuindo Para Viabilizar a Aquisio de Conhecimento da Populao.............................220 SAMUEL APOLONIO, MARCOS BORGES, ADRIANA VIVACQUA VIII Simpsio Brasileiro de Sistemas Colaborativos- VI -PREFCIO Bem-vindosaoVIIISimpsioBrasileirodeSistemasColaborativos(SBSC) realizado na charmosa cidade histrica de Paraty, no estado do Rio de Janeiro, de 5 a 7 de outubro de 2011. Este um evento que se firma cada vez mais como um importantefrumquepropiciacomunidadeAcadmicaBrasileiradebater questes,tcnicas,solues,inovaeseexperinciassobreestarea multidisciplinar. No exagero afirmar que o computador mudou o mundo. Mas pode-se afirmar queosSistemasColaborativoscomocorreioseletrnicos,redessociais, ambientesvirtuais,videoconferncia,blogeoutroscausaramumaverdadeira revoluo social e porque no dizer at uma mudana de hbitos e costumes. As notcias, os fatos, informaes e acontecimentos correm em velocidade espantosa nainternet.Revolueseconmicassooriginadasdeintensacomunicao eletrnica. difcil reter segredos. O mundo, de fato, virou uma simples aldeia. Nessesentido,oeventoentrafirmenesseinstiganteuniversoeestamos orgulhosos de apresentar um programa rico e diversificado que reflete o interesse correntedacomunidadedesistemascolaborativos.Apreparaodesta conferncia, que compreendeu as etapas de submisso de trabalho, anlise critica eseleo,permitiuenvolverpesquisadoresdediversosestadosbrasileiros incluindoAL,BA,MG,MT,PB,PE,PR,RJ,SPeSC.Arealizaoconjunta comoCRWIGpermitiuenriquecernossofrumnacionalcomcontribuies internacionais, tanto em termos de artigos, quanto de palestrantes convidados. Aelevadaqualidadedosartigossubmetidosdificultouoprocessoseletivo.Foram 41 artigos completos submetidos para os 16 artigos aceitos (39% de ndice de aceitao). O programa do SBSC2011 est organizado em sesses temticas que refletem as principaisreasdeinteressedacomunidade:interaosocialemsistemas colaborativos,colaboraoemmicros-mundos,colaboraoatravsde dispositivosmveis, sistemas de recomendao, disseminao de conhecimento, desenvolvimentodesistemascolaborativos,ferramentaseaplicativos.Os16 artigoscompletose13artigosresumidosestoagrupadosedivididosnostrs dias de conferncia.Ostrsdiasdesessestcnicasseroantecedidosporapresentaesde palestrantesrenomados.Noprimeirodia,5deoutubro,DaveRandalapresenta suavisosobreopapeldasociologianoprojetodesistemascolaborativos.No VIII Simpsio Brasileiro de Sistemas Colaborativos- VII -segundodia,GerhardFischer(ColoradoUniversity)apresentaaexperinciade seugrupodepesquisanoentendimentoeapoioculturadeparticipao. Finalmente,fechandoaconferncia,ClarissedeSouza(PUC-Rio)compartilha sua viso sobre o papel do computador como meio de expresso. Oprogramadaconfernciatambmincluiumworkshopdetesesedissertaes que conta com oito apresentaes e dois cursos tutoriais: Introduo a Sistemas ColaborativoseNoSQLnodesenvolvimentodeaplicaesWeb colaborativas.Oprimeirodelesofereceumavisogeraldareaeosegundo trata de questes de implementao de sistemas colaborativos.Duranteosimpsio-quetemcomoCoordenadorGeraloProfessorMarcosda SilvaBorges,daUniversidadeFederaldoRiodeJaneiro(UFRJ)-havero lanamentodolivroSistemasColaborativos,ed.Campus/Elsevier,quevem cobrir a lacuna de um livro texto para alunos de graduao. O livro foi formulado porumconjuntorepresentativodepesquisadoresdacomunidadeacadmica brasileira.Gostaramosdeagradeceroapoiodospalestrantespordaremvidaaosimpsio, do comit de programa pelas revises, pelos rgos de fomento (CAPES, CNPq, CGI,SBC)peloapoio,pelaequipedaUFFeUFRJquetiverampapel fundamentalnosbastidoresdaelaboraodoevento,edetodosque voluntariamente ajudaram a fazer o SBSC2011 possvel. Estamos certos que a confernciaproverexcelentesoportunidadesparacompartilharsoluese questes,tecnologiasemodelosnareadesistemascolaborativos,assimcomo permitir a criao de laos de pesquisa entre os participantes. Finalizando,parasediaroeventofoiescolhidaabelaehistricacidadede Paraty, cuja arquitetura colonial convida reflexo, ao aprendizado e porque no dizeraventuraintelectual,anovoscaminhos.QueParatysejaopalcoonde novosprojetoseideiassurgiroparaincrementaraindamaisossociaise popularesSistemasColaborativos.Aexcelncia,oaltonveldospalestrantese organizadores,workshopseminicursosconfirmaroisso.BemvindosaParaty. Aproveitem bem a conferncia, e bom trabalho! Paraty, outubro de 2011. Ana Cristina Bicharra Garcia Pedro Antunes COORDENAO DO COMIT DE PROGRAMA SBSC 2011 VIII Simpsio Brasileiro de Sistemas Colaborativos- VIII -ORGANIZAO SBSC 2011 Coordenao do Comit de ProgramaAna Cristina Bicharra Garcia (UFF) Pedro Antunes (Universidade Tcnica de Lisboa) Organizao do EventoMarcos Roberto da Silva Borges (NCE-UFRJ) Coordenao de MinicursosAlberto Raposo (PUC-Rio) Coordenao do Workshop de Teses e DissertaesMarco Aurlio Gerosa (IME/USP) Comit de ProgramaAdriana Santarosa Vivacqua (DCC-IM-UFRJ) Ana Carolina Salgado (UFPE) Ana Cristina Bicharra Garcia (UFF) Alberto Castro (UFAM) Alberto Raposo (PUC-Rio) Carla Diacui Berkenbrock (UDESC) Carlos Andr Guimares Ferraz (UFPE) Celso Massaki Hirata (ITA) Cesar Augusto Tacla (UTFPR) Claudia Cappelli (UNIRIO) Cleidson Ronald Botelho de Souza (UFPA) Clver Ricardo G. de Farias (FFCLRP/USP) Clovis Torres Fernandes (ITA) Cristiano Maciel (UFMT) Denise Del Re Filippo (UERJ) Edeilson Milhomem Silva (CEULP/ULBRA e UFPE) Flvia Bernardini (UFF) Flvia Maria Santoro (UNIRIO) Geraldo Bonorino Xexo (COPPE-UFRJ) Hugo Fuks (PUC-Rio) Ivan Luiz Marques Ricarte (UNICAMP) Jacques Wainer (UNICAMP) Jano Souza (UFRJ) Jauvane Cavalcante de Oliveira (LNCC) Jonice Oliveira (UERJ) Jose Maria Nazar David (UFJF) Kate Revoredo (UNIRIO) Marco Aurlio Gerosa (IME/USP) Marco Aurlio Souza Mangan (PUC-RS) Mariano Pimentel (UNIRIO) Melise Maria Veiga de Paula (UNIFAL-MG) Neide dos Santos (UERJ) Pedro Porfirio Farias (Unifor) Rafael Prikladnicki (PUC-RS) Raquel de Oliveira Prates (UFMG) Renata Mendes de Araujo (UNIRIO) Roberta Lima Gomes (UFES) Roberto Willrich (UFSC) Seiji Isotani (CMU) Sergio Crespo C. da Silva Pinto (UNISINOS) Daniel Paiva (ADDLabs) Vaninha Vieira (UFBA) VIII Simpsio Brasileiro de Sistemas Colaborativos- IX -Comit Gestor da Comisso Especial 2011Mariano Pimentel (UNIRIO) - Coordenador Claudia Lage Rebello da Motta (NCE-UFRJ) - Vice-coordenadora Celso Massaki Hirata (ITA) Denise Del Re Filippo (UERJ) Marco Aurlio Gerosa (IME/USP) Renata Mendes de Araujo (UNIRIO) Vaninha V. Santos (UFBA)

Comit de Programa do Workshop de Teses e DissertaesAdriana Santarosa Vivacqua (UFRJ) Alberto Raposo (PUC-Rio) Celso Hirata (ITA) Denise Del Re Filippo (UERJ) Jose Maria Nazar David (UFJF) Renata Arajo (UNIRIO) Roberta Lima Gomes (UFES) Vaninha Vieira (UFBA) VIII Simpsio Brasileiro de Sistemas Colaborativos- X -PALESTRAS CONVIDADAS Compreenso, Promoo e Apoio Cultura de Participao. Gerhard Fischer (University of Colorado USA) DiretordoCentroparaaAprendizagemaoLongodaVidaeDesign.Professor do Departamento de Cincia da Computao, e membrodoInstituto de Cincia Cognitiva, todos pertencentes a Universidade de Colorado (EUA). MembroHumanComputerInteractionAcademy(CHI)edaAssociationfor Computing Machinery (ACM). Suas linhas de pesquisa incluem: aprendizagem ao longo da vida, design, meta-design,designdesoftware,criatividade,criatividadesocial,inteligncia distribuda,interaohomem-computador,edesignparatodos(tecnologiasde apoio). Computadorcomomeiodeexpresso:novasfalasna contemporaneidade. Clarisse Sieckenius de Souza (PUC-Rio) Graduou-secomoTradutoraeIntrpretedeConfernciapelaPUC-Rio,onde tambmobtevettulomestradoemPortugusedoutoradoemLingstica Computacional. Em1988elaentrouparaoDepartamentodeInformticadaPUC-Rio,onde comeounareadeInteraoHumano-Computador.Clarissetambm professora visitante em diversas universidades e institutos, como Stanford (com TerryWinograd),UniversityofWaterloo(comTomCarey),eUMBC(com Jenny Preece).

Em 1996, ela fundou SERG (Grupo de Pesquisa em Engenharia Semitica), que desenvolvepesquisadepontaemIHC,EngenhariaSemiticaeLingstica Computacional. VIII Simpsio Brasileiro de Sistemas Colaborativos- XI - S E S S O 1Interao Social Entendendo a Twitteresfera BrasileiraFabrcio BenevenutoDECOM - UFOPOuro Preto, MG, BrazilCampus Universitrio+55 31 [email protected] SilveiraDECOM - UFOPOuro Preto, MG, BrazilCampus Universitrio+55 31 [email protected] OliveiraDECOM - UFOPOuro Preto, MG, BrazilCampus Universitrio+55 31 [email protected] BombonatoDECOM - UFOPOuro Preto, MG, BrazilCampus Universitrio+55 31 [email protected] FortesDECOM - UFOPOuro Preto, MG, BrazilCampus Universitrio+55 31 [email protected] Pereira Jr.DECOM - UFOPOuro Preto, MG, BrazilCampus Universitrio+55 31 [email protected] has been constantly growing as an important sys-temwhereusersdiscussabouteverything,expressingopini-ons,politicalview,sexualorientation,andeventheirmoodlikehappiness or sadness. Social networks arepointedasplaces whereusers inuenceandareinuencedbyothers,beingaperfectenvironmentforword-of-mouthmarketing,advertisement, andpolitical campaigns. InordertooerabetterunderstandoftheuseofTwitterinBrazil,thisworkprovides a wide characterization of Brazilian users in TwitteraswellasadeepunderstandofthecontentpostedbyBra-zilians in Twitter. We correlate Brazilian demographic datawithgeographicdatafromtheTwitteruserstoshowthatsomeBrazilianstatesareunderestimatedinTwitter. Ad-ditionally, wecharacterizethedierent linguisticpatternsadopted, weanalyzedthemostpropagatedURLs, andweidentiedthemostinuentialBrazilianusersinTwitteroneachBrazilianregion.RESUMOOTwitter vemconstantementecrescendocomoumim-portante sistema onde usuarios discutemsobre tudo, ex-pressandoopinioes, visaopoltica, orientac aosexual eatemesmohumor, comofelicidadeoutristeza. Redes sociaissaoapontadascomolocaisondeusuariosinuenciamesaoinuenciadosporoutrossendo, portanto, ambientesperfei-tosparaarealizac aodemarketingboca-a-boca, propagan-das ecampanhas polticas. Comointuitodeoferecer en-tendimentosobreousodoTwitternoBrasil, estetrabalhoproveumaamplacaracterizac aodosusuariosbrasileirosnoTwitteredoconte udopostadoporessesusu arios. Noscor-relacionamosdadosdemogracosbrasileiroscomdadosdalocaliza c ao dos usuarios do Twitter para mostrar que algunsestadosbrasileirosestaosubestimadosnessesistema. Alemdisso, noscaracterizamososdiferentespadroeslingusticosadotados, analisamosasURLsmaispropagadas, eidenti-camososusuariosbrasileirosmaisinuentesnoTwitteremcadaregi aobrasileira.Categories and Subject DescriptorsH.3.5[OnlineInformationServices]: Web-basedser-vices;J.4[ComputerApplications]: Socialandbehavio-ralsciencesGeneral TermsExperimentation,MeasurementKeywordsTwitter,Microblog,Web2.01. INTRODUODesde seu incio a Internet tem sido palco de uma serie denovasaplicacoesincluindoaWWWeemail. Atualmente,aWebtemrecebidoumanovaondadeaplica c oesassocia-das aocrescimentoeproliferac aodas redes sociais online.V ariosdessessistemassurgiram,incluindoredesdeprossi-onais(ex. LinkedIn), redesdeamizade(ex. MySpace, Fa-cebookeOrkut),eredesvoltadasparaocompartilhamentodealgumtipoespeccodeconte udocomomensagenscur-tas(ex. Twitter), diarioseblogs(ex. LiveJournal), fotos(ex. Flickr)evdeos(ex. YouTube).Em particular, o Twitter surgiu como uma plataforma so-cial na Web onde usuarios discutem sobre tudo, expressandoopinioes,visaopoltica,orientac aosexualeatemesmocon-ceitos vagos como humor e felicidade. Alem disso, o Twittertematradoapopularidade de jornais e celebridades, co-nectadosausuarioscomunsatravesdeelosdeseguidoreseseguidos pelos quais usuarios podem trocar informac oes. Es-timativas sugerem que,atualmente,os 200 milhoes de usua-rios ativos do Twitter postam cerca de 150 milhoes de tweets(mensagens)contendocercade23milhoesdeURLsdiari-amente[4, 25]. SegundoacomScore, oBrasil eoterceiropasondeoTwittermaiscresceatualmente[12].Comtantapopularidade, oTwitter setornouumapla-taformaparaadescobertadeinforma c aoemtemporeal evemsemostrandoumaimportanteferramentaparaadisse-minac aodenotciasde ultimahora, taiscomorevoluc oesedesastres. Alemdisso,GoogleeBingjaindexamtweetsp u-blicos como forma de prover busca por informac ao em temporeal[23]. Comoconsequencia,oTwittervemsendoalvodediversossistemasrelacionados`adescobertadeinformac oesVIII Simpsio Brasileiro de Sistemas Colaborativos- 1 -em tempo real, como a identicacao autom atica de terremo-tosapartirdaanalisedetweets[20], extrac aodeopnioesdeeleitoresemrelacaoacandidatosacargospolticos[24]eatemesmocomofontededadosparaomonitoramentodecasosdedenguenoBrasil[14].Apesar da comprovada aplicabilidade desses estudos e fer-ramentas, poucosesabesobreousodoTwitternoBrasil.Como exemplo, nao sabemos se um determinado estado bra-sileiroestasubousuperrepresentadonoTwitteremrela-c ao` asuademograareal, oquepoderiaterprofundoim-pactonosresultadosreportadosporferramentasbrasileirasquemonitorameventosnoTwitter. PoucosesabesobreousodoTwitternoBrasilcomrelac aoaostemasdiscutidos,usuariosmaisinuentes, sitesmaisdivulgadosnoTwitter,etc. Nestecenario, apesardehaverumgrandeinteressedeempresasbrasileirasemdivulgarprodutoserealizarpropa-gandaboca-a-boca, poucose sabe sobre quais estrategiasrealmenteseriamefetivas. Nessecontexto,acreditamosqueumaamplaan alisedatwitteresferapoderiaoferecerrespos-tasparav ariasdessasquestoes.Estetrabalhovisadar umprimeiropassonessadirec aodeformaarealizarumaamplaanalisedoconte udopostadopor brasileiros noTwitter. Paraisso, utilizamos umaco-lec aoquepossui 55milhoesdeusuariosdoTwitter, todososelosdeseguidoreseseguidos(grafocomquase2bilhoesdeelos)etodosostweetspostadosporessesusuarios(1.8bilhoes de tweets). Dadoque oBrasil e umpas taoex-tensoe diversicado, alocalizac aogeogr acadas pessoaspodeterumimportantepapel nosassuntosdiscutidos, nostemas compartilhados eatemesmonafelicidadeenohu-mordaspessoas. Sendoassim, identicamosalocalizac aogeogracadeusuariosdotwitterpararealizarumaan alisesobreseuusonasdiferentesregioesbrasileiras.Nossasanalisesrevelamquealgunsestadosbrasileiroses-t ao subestimados no Twitter em relacao a dados demogra-cos, sendoquecaractersticassocio-economicasdessesesta-dos parecem inuir no n umero de usu arios do Twitter. Alemdisso,nossasanalisesaindarevelampadroeslingusticosas-sociadosaousodemicroblogsnoBrasil, identicandonaosoostermosmaisfrequentesnostweetspostadosporbra-sileiros, mastambemaquelesassociadosacontextosfelizesetristes. NosaindaanalisamosasURLspostadasporbra-sileirosnoTwitterecomparamosapopularidadedosstiosweb mais populares no Twitter com a popularidade desse s-tiosnaWebdemaneirageral. Por ultimo,foramestudadasdiferentes abordagens para identicar os usu arios brasileirosmaisinuentesnoTwitterefoi construdoumrankingdeusuariosinuentesparacadaregiaodoBrasil. Acreditamosqueametodologiaempregadanasan alisespresentesnessetrabalho pode guiar futuros trabalhos e ferramentas que pre-tendemrealizaralgumtipodemonitoramentodedadosex-tradosderedessociaisonline,emespecialoTwitter.O restante do trabalho est a organizado da seguinte forma.Asec ao2descrevetrabalhosrelacionados. Asec ao3des-creveaestrategia adotada paraa coletade dados datwitte-resferabrasileira. Asec ao4apresentadadosdademograados usuarios brasileiros doTwitter. Asec ao5apresentaostermosmaisfrequentesutilizadospelosbrasileiros, bemcomo uma analise da polaridade desses termos. Em seguida,a secao 6 analisa os domnios das URLs mais populares pro-pagadas no Twitter. A sec ao 7 indentica os usuarios brasi-leirosmaisinuentesdecadaregiaobrasileira. Finalmente,asec ao8oferececonclusoesedirec oesparatrabalhosfutu-ros.2. TRABALHOS RELACIONADOSOTwittertemsidoalvodeumgranden umerodetraba-lhos relacionados `as suas caractersticas topologicas e aspec-tos da intera cao de seus usuarios. Kwak e colaboradores [16]estudaram a topologia do Twitter, encontrando distribui c oesqueseguemleisdepotenciaparaon umerodeseguidoreseseguidos, umdiametrocurtoe baixareciprocidade. Elesaindaestudaramabordagenspararanquearusuariosbasea-dasnousodoPagerankcalculadosobreaestruturadese-guidores e seguidos noTwitter. Mais recentemente, Chaecolaboradores[10]mostraramqueusuariosinuentesnaosaonecessariamenteosusuariosmaisseguidosdoTwitter,oquesignicaqueatopologiadoTwitterpodenaosersu-cienteparacapturarainuenciadosusuarios. Scellatoecolaboradores [21] estudaramcomoinformacaopropagadanoTwitter podeser exploradaparamelhorar sistemas decachesdearquivosmultimdiaemredesdedistribuic aodeconte udo(CDNs- Content DistributionNetworks). Comoresultadoselesmostraramqueon umerodeacertosemca-che pode ser aumentado em rela c ao a polticas de caches quenaolevamemconsiderac aoinformac oesgeogracasesoci-ais. Rodriguesecolaboradores[18] proveemumaseriedeanalisessobreospadroesdepropagac aodeinformacaoen-treosusuariosdoTwitter. Alemdequanticaroaumentodeaudienciadeumainformac aoqueretweetspodemcau-sar, eles identicaram caractersticas tpicas da estrutura dasarvoresdepropagac aodeinformac aonessesistema. Final-mente,aexistenciadephishing[11]espammersnoTwittervemsendoconstantementereportada[17] eesforcosrecen-tes propuseram abordagens para a detec c ao de spammers noTwitter[7].Alguns trabalhos recentes analisarama repercussao deeventosespeccosnoTwitter. Emparticular, Sakakieco-laboradores [20] mostraramopoder dainformac aodispo-nibilizadaemtemporeal nasredessociaisonlinepropondoummecanismoparadeteccaodeocorrenciasdeterremotosbaseadoemmonitoramentodoTwitter. Aabordagem,queconsisteidenticartweetsrelacionadosaterremotosporre-giao, foi capazdeenviaralertassobreterremotosmaisra-pidamentedoqueagenciasmeteorologicas. Tumasjaneco-laboradores [24] mostraramque opinioes identicadas emtweetsrelacionados`aeleic aofederal alemafoi capazdere-etirosentimentopolticoregistradoforadasredessociais.Mais recentemente, uma analise geograca e temporal sobredengue no Twitter foi realizada por Gomide e seus colabora-dores[14]. Deformacomplementaraessestrabalhos,nossotrabalhoofereceumavisaogeraldousodoTwitternoBra-silenaoanalisasomentearepercussaodeumdeterminadoevento.3. METODOLOGIA DE MEDIOEm um passado recente, redes sociais eram um domnio desociologoseantropologos,queutilizavampesquisaseentre-vistas com pequenos grupos de usuarios como ferramentas decoletadedados. Comosurgimentodasredessociaisonline,a obten c ao de dados reais em larga escala se tornou possvel,e pesquisadores de diversas areas da computa c ao comecarama realizar coletas de dados. Entretanto, a coleta de conte udocriadoporusu ariosenvolveumgranden umerodedesaos.Estasec aoapresentaametodologiaadotadaparaaobten-VIII Simpsio Brasileiro de Sistemas Colaborativos- 2 -caodosdadosutilizadosemnossasmedic oes. Inicialmente,asec ao3.1descreveaestrategiaadotadaparacoletarda-dos doTwitter. Emseguida, asec ao3.2discuteacoletadalocalizacaogeogr acadeusuariosdoTwitter, deformaapermitirarealizac aodeanalisesrestritas`atwitteresferabrasileira. Asec ao3.3descreveoprocessoutilizadoparaidenticartweetsfelizes, tristesouneutros. Finalmente, asec ao3.4discutepossveislimitacoesdosdadosobtidos.3.1 Coleo de dados do TwitterEsta sec ao descreve brevemente a estrategia utilizada paraconstruirumacole c aodedadosdoTwitter. Podemosaces-sarcadausuariodosistema,vistoqueoTwitteratribuiumidenticador(ID)numericoesequencial paracadausuariocadastrado[6]. Comonovosusuariosrecebemumidenti-cadorsequencial, podemospercorrertodososIDs, semterquevericaralistadeamigosdessesusuariosembuscadenovosIDsparacoletar.Recentemente, nosrealizamosumacoletadoTwitterse-guindoessaestrategia. Foi solicitadoaos administradoresdoTwitterapermissaopararealizarumacoletaemlargaescala. Emresposta, elesadicionaramosenderecosIPsde58maquinassobnossocontroleemumalistabranca, compermissaoparacoletardados. Cadaumadas58m aquinas,localizadas noMax Planck Institute for Software Systems(MPI-SWS), na Alemanha1, teve permissao para coletar da-dos a uma taxa maxima de 20 mil requisic oes por hora. Uti-lizandoaAPIdoTwitter,nossocoletorinvestigoutodosos80milhoesdeIDsdeformaseq uencial, coletandotodasasinformac oes p ublicas sobreesses usuarios, bemcomoseuselosdeseguidoreseseguidosetodososseustweets. Dos80milhoesdecontasinspecionadas, encontramoscerca55mi-lhoesemuso. IssoaconteceporqueoTwitterapagacontasinativasporumperodomaiordoque6meses. Nototal,coletamos54.981.152 milhoesde usuarios,todos oselos deseguidoreseseguidos, quecorrespondema1.963.263.821elos unicos etodos os tweets postados por esses usuarios,emumtotal de1.755.925.520tweets. Aoinspecionaraslistasdeseguidoreseseguidoscoletadas, naoencontramosnenhumidenticador acimados80milhoesinspecionados,sugerindoque coletamos todos os usuarios dosistemanaepoca. Paraumadescric aomaisdetalhadadessesdadosedastecnicasempregadasparaarealizac aodacoletadessesdados, recomendamosaoleitorasseguintesreferencias[10,6].3.2 Coleta de informaes geogrcasParaidenticarmosusuariosetweetsbrasileirosprecisa-mos primeiramente identicar a localizac ao e origemdostweetsnosdadoscoletados. Alocalizac aodosusuariosdoTwittercoletadosaparecenaformadetextolivreefreque-mentecontemlocalizac oesinvalidas, taiscomo Marte ouminha casa. Alem disso, e muito comum usuarios abrevia-rem localizac oes como BH para Belo Horizonte, Sampa paraSaoPaulo, eFloripaparaFlorianopolis. AAPI doTwit-terprovealatitudeealongitudeapenasdosusuariosqueutilizamaparelhos moveis comservicoGPSepermitemocompartilhamentodessetipodeinformac ao. Essesusuarioscorrespondem a uma frac ao muito pequena dos usuarios, es-pecialmentenoperodoemqueosdadosforamcoletados.1Esta coleta foi realizada pelo primeiro autor desse trabalhoduranteumavisitaaoMPI-SWSComoformaderealizarumaestrategiasistematicadeseobteralocaliza c aodosusuarios,foiutilizadaaAPIdoGo-ogleGeocodingparatraduzir endere cos emformatotextoemcoordenadas geogr acas (latituteelongitute). AAPIdoGoogle Geocodinge utilizadapor diversos servicos doGooglequeutilizammapasetemcomovantagemidenti-carcorretamentelocalizac oesabreviadas,comoBH,SampaeFloripa. EssaAPIproveummecanismodiretodeseob-terascoordenadasgeogr acas, opas, oestadoeacidadeapartirdeumalocaliza c aofornecidaemtextoatravesdeumarequisic aoHTTP [15]. Nos casosemqueousuariofor-neceudiretamentecoordenadas geogr acas atraves dousodeaparelhosmoveiscomGPS,oGoogleGeocodingfoiuti-lizado apenas para buscar o nome da cidade e do pas dessesusuarios.EimportanteressaltarqueaAPI doGoogleGeocodinglimitaon umeromaximoderequisic oesporIPa200requi-sic oesporhora. Essataxatornadifcilaobten caodaloca-lizac aodetodososusuarioscoletadosquecorrespondemaquase 55 milhoes de usuarios. Sendo assim, nos restringimosacoletaaosusuarioscujofusohor ariofosseumdosadota-dos noBrasil. Alemdisso, foi implementadoumsistemadecachedelocaliza coes, deformaaevitarqueduaslocali-za c oesidenticasfossemrequisitas`aAPI dogoogleGeoco-ding. Dos 923.232 usuarios investigados, foram identicados198.714usu arioscomlocalizacaodetalhadanonvel deci-dades. Nototalessesusuariospostaram29.013.854tweets.Essesusuariosetweetscorrespondemaoconjuntodedadosqueanalisaremosnasproximassec oes.3.3 Identicao de sentimentosEmoticonsrepresentamumaexcelenteformadecapturaremoc oes expressas no texto, pois eles capturam a emoc ao doescritorqueincluiumaexpressaof acilutilizandocaracteresASCII.N osdenimostrescategoriasparaclassicartweetsdeacordocomapresen cadeemoticons: positivo, negativoouneutro. Atabela1apresentaosemoticonsutilizados, on umerodetweetsemcadacategoria. Notequenosclassi-camossomenteostweetscomlocalizac aogeogr aca, quesaoosqueutilizaremosemnossasanalises.3.4 Limitao dos dadosApesar do conjunto de dados coletado nos permitir a opor-tunidade unica de estudar as caractersticas da twitteresferabrasileira, esses dados possuemalgumas limitac oes. Pri-meiro,nossaanalise erestritaaoperodocoletadodoTwit-ter, quecontemdadosdesdeacriac aodoTwitterem2006ateJulhode2009,queeumperodonoqualoTwittereramuito mais popular nos EUA. Segundo, para examinar a lo-calizac ao geogr aca dos usuarios, nos consideramos que cadausuariopossui uma unicalocalizac aoxa, desconsiderandoqueusuariospodempostartweetsdediferenteslocalidades.Finalmente, 21,5%dos usuarios investigados tiveramsuasCategoria Emoticons TweetsPositivo :-):D:)=D=) 2.244.628Negativo :-(:(D:): T.T=\~ :\~:(=[TT:-( :,( ]=)-: :,-( ),: :-(=-[:-,(468.903Neutro 26.300.323Tabela1: Categoriasdetweetsdeacordocomapre-sen cadeemoticonsVIII Simpsio Brasileiro de Sistemas Colaborativos- 3 -localizac oesidenticadas.4. USURIOS E TWEETS POR REGIONesta sec ao apresentamos uma analise do n umero de usua-riosdoTwittercomrelac ao`apopulacaodecadaestadoe`aproporc aodapopulac aocomacesso` ainternet, apartirdedadosdoInstitutoBrasileirodeGeograaeEstatstica(IBGE) [2]. ATabela2apresentaon umerode usuariosdoTwitter, on umerodetweets, apopulac aoem2007eopercentualdapopula c aocomacesso` ainternet(2008),paracadaumdosestadosbrasileiroseagregadosporregiao. Asduas ultimascolunasapresentam,respectivamente,amediadetweetsenviadosporusuarioparacadaestado(usu ariosativos: razaoentreon umerodetweetseon umerodeusua-rios),eopercentualdapopulac aoqueusaoTwitter(razaoentreon umerodeusuarioseapopulacaodecadaestado).Observando o percentual da popula c ao que usa o Twitter,vemos que as unidades da federac ao que mais usam o Twittersao Distrito Federal, Sao Paulo e Rio de Janeiro, com 0,21%da populacao, seguidos pelos estados do Sul (Santa Catarina,ParanaeRioGrandedoSul),todoscom0,11%. Emgeral,oNorteearegiaoquemenosusaoTwitter, seguidopelaregiaoNordesteelogopelaregiaoCentroeste.Observando a coluna com a media de tweets enviados porusuario,deformageralvemosqueasunidadesdafederac aocommaisusuariosemproporc ao`apopulac aosaotambemas unidades com os usuarios mais ativos. Este dado pode serconsequenciadopropriofatodousosermaiorentreaspes-soas no estado, uma vez que ha inuencia do meio social queapessoaestainseridanocomportamentodapessoa(nestecaso o comportamento e usar de forma ativa o Twitter comoferramenta social). Apesar dessa observac ao geral, ela nao eumaregra. HaestadoscomoPernambuco, Ceara, Alagoas,Piau eEspritoSantoquepossuemalto ndicedeusuariosativos,maspoucosusuariosemproporc ao.Observamos que nao ha uma correlac ao entre o n umero deusuarioseapopulacaodosestados. Porexemplo,varioses-tadosdaregi aonortebrasileirapraticamentenaopossuemusuarios identicados emnossa base de dados. ABahiapossuiamaiorpopulacaodaregiaonordesteeaquartapo-pulac aodoBrasil,mas eumdosestadosquemenosusamoTwitter no Brasil. Em contrapartida, o Distrito Federal temumabaixapopula c aoeumagrandeproporc aodeusuariosnoTwitter,aopassoqueSaoPaulotemamaiorpopula c aodoBrasilegrandeproporc aodeusuariosnoTwitter.Com relac ao ` a frac ao da populac ao com acesso ` a internet,h aalgumarelac aocomousodoTwitter, masnaoeumaregra. Maisde56%dapopulacaodoDistritoFederal temacesso`aInternet (ndicebemmaior quedos demais esta-dos),e eumdosquemaisusamoTwitter. Entreosdemaisestados quemais usamoTwitter (SaoPaulo, RiodeJa-neiro,SantaCatarina,ParanaeRioGrandedoSul),todospossuembom ndicedepessoascomacesso`ainternet,com-parandocomosdemaisestadosbrasileirosecomamedianacional (32,7%). Poroutrolado, haestadosquetemboataxadeacesso`ainternet, masbaixousodoTwitter, comoRioGrandedoNorteeMatoGrossodoSul.Estudamosaindaseexisterelac aoentreousodoTwitterearendamediamensal familiardosestadoseoPIBdoses-tados,masnenhumarelac aofoiobservada. PorestemotivonaoapresentamosestesdadosnaTabela2.5. TERMOS FREQUENTESNesta sec ao faremos uma analise dos termos mais frequen-tesencontradosemtweets. Agura1apresentaanuvemdos150termosmaisfrequentes, semqualquerltro(inclu-sivestopwordsforammantidas).Figura 1: Nuvemdos termos mais frequentes emtweetsAlguns padroes interessantes foramobservados na listados termos mais frequentes (considerando os 300 termosmaisfrequentes). Primeiramente,vemosquehaumgranden umero de substantivos relacionados a tempo de algumaforma, ouadjuntosadverbiaisdetempo, como: dia, agora,hoje, noite, tempo, semana, amanha, sempre, hora, tarde,ontem, nunca, anos, dias, sexta, ano, horas (nestaordemdefrequencia). OTwitterpareceserumaferramentausadaparadescrever fatos oueventos que aconteceramrecente-mente, estaoacontecendo, ouvaoacontecer, oquejusticaafortepresencadetermosindicadoresdetempo.Observamostambemqueotextonostweetssaoemgeralinformais, comapresencadeumconjuntodeabreviac oescomunsentreosusuarios, como: d(de), q(que), p(para),vc(voce), ta(est a), pq(porque), gt(gente), to(estou), hj(hoje), s (sem), tava(estava), rs (risos), eh(e), tb(tam-bem), tbm(tambem)(nestaordemdefrequencia). Ainda,h aumconjuntodetermosbeminformaisquemuitasvezesn aofazemparte dodicionariodalnguaportuguesa, massaousadoscomfrequenciaporumgranden umerodeusua-rios,como: so,cara,a,hahaha,ne,haha,legal,ah,hehehe,hahahaha, hehe,oi, xd. Dasformasutilizadasparaexpres-sar um sorriso, ou uma risada, vemos que hahahae a maisusuada,equenaoh aumpadr ao unico,sendousadasaindaasexpressoes: haha,hehehe,hahahaha,hehe,rs,xd.Aseguiranalisamosostermosrelacionadosatweetscompolaridadepositivaerelacionadosatweetscompolaridadenegativa. Dois conjuntos com os 1.000 termos mais frequen-tesforamgerados: umsomentedostweetscompolaridadepositivaeoutrosomentedostweetscompolaridadenega-tiva. A diferenca destes conjuntos foi usada para gerar duaslistasdetermos: umadostermosdetweetscompolaridadepositiva que nao ocorremcomfrequencia emtweets compolaridade negativa, e outra dos termos de tweets com pola-ridadenegativaquenaoocorremcomfrequenciaemtweetscompolaridadepositiva. As nuvens dos 150termos maisfrequentesdestaslistassaoapresentadasnasguras2e3,respectivamente.Einteressanteobservarostermosqueocorrememtweetscompolaridade positivaque naoocorremcomfrequenciaem tweets com polaridade negativa, como: obrigado, adorei,viva,otima,boas,bacana,bastante,beleza,sucesso,indico,bons, rir, gostar, recomendo, concordo, bonito, divertido,VIII Simpsio Brasileiro de Sistemas Colaborativos- 4 -N umerode N umerode Populacao Percentagemdouso Usuarios Perc. dapopula caoEstado usuarios Tweets 2007 deinternet2008 ativos queusaoTwitterRondonia 0 0 1.453.756 31,0 0,0 0,000Tocantins 596 72.500 1.243.627 31,3 121,6 0,047Amapa 267 31.066 587.311 31,3 116,4 0,045Para 1.814 206.048 3.641.395 23,9 113,6 0,049Amazonas 935 120.375 3.221.939 30,2 128,7 0,029Roraima 59 1.401 7.065.573 35,3 23,7 0,001Acre 304 18.139 655.385 29,4 59,7 0,046RegiaoNorte 3.975 449.529 17.868.986 30,3 113,1 0,022Alagoas 809 113.172 3.037.103 17,8 139,9 0,026Pernanbuco 4.569 722.882 8.485.386 25,6 158,2 0,053RioGrandedoNorte 1.956 263.550 3.013.740 43,2 134,7 0,064Bahia 4.034 488.144 14.080.654 26,9 121,0 0,028Paraba 1.710 223.584 3.641.395 26,4 130,8 0,047Maranhao 1.010 86.098 6.118.995 20,2 85,2 0,016Sergipe 716 68.274 1.939.426 29,3 95,4 0,036Ceara 3.710 554.833 8.185.286 25,8 149,6 0,045Piau 838 119.015 3.032.421 20,2 142,0 0,027RegiaoNordeste 19.352 263.9552 51.534.406 26,2 136,4 0,037SantaCatarina 6.527 999.253 5.866.252 40,2 153,1 0,111RioGrandedoSul 12.114 1.671.759 10.582.840 36,3 138,0 0,114Parana 11.774 1.685.625 10.284.503 40,2 143,2 0,114RegiaoSul 30.415 4.356.637 26.733.595 38,9 143,2 0,113SaoPaulo 84.584 12.895.459 39.827.570 43,9 152,5 0,212RiodeJaneiro 33.247 4.953.433 15.420.375 40,9 149,0 0,215MinasGerais 1.5118 2.100.818 19.273.506 33,1 139,0 0,078EspritoSanto 1.714 241.625 3.351.669 35,3 141,0 0,051RegiaoSudeste 134.663 20.191.335 77.873.120 38,3 149,9 0,172DistritoFederal 5.327 867.362 2.455.903 56,1 162,8 0,216MatoGrosso 824 78.166 2.854.642 33,8 94,9 0,028MatoGrossodoSul 817 85.244 2.265.274 39,2 104,3 0,036Goi as 3.341 346.029 5.647.035 35,2 103,6 0,059RegiaoCentroeste 10.309 1.376.801 13.222.854 41,1 133,6 0,078Total 198.714 29.013.854 187.232.961 32,7 146,0 0,106Tabela2: DadosdeusuariosetweetsdoTwitterrelacionadoscomdadosdoIBGEFigura2: Nuvemdostermosqueocorrememtwe-ets compolaridade positivaque naoocorremcomfrequenciaemtweetscompolaridadenegativaengracado, especial, parabens, querida, gracas. Tambemeinteressanteobservarostermosqueocorrememtweetscompolaridade negativa que nao ocorrem com frequencia em twe-ets com polaridade positiva, como: triste, droga, morreu, te-dio, chorar, morrer, infelizmente, doente, sozinha, cansada,raiva.6. URLS MAIS PROPAGADASMensagensnoTwitterpodemconternom aximo140ca-racteres. Tal restricao de espaco servicos tem tornado encur-Figura3: Nuvemdostermosqueocorrememtwe-ets compolaridadenegativaquenaoocorremcomfrequenciaemtweetscompolaridadepositivatadoresdeURLscadavezmaispopulares. Essessistemasfuncionam da seguinte forma. Eles traduzem uma URL (quepode consistir de centenas de caracteres) em uma nova URL,tipicamentecompoucos caracteres queretornaos c odigosHTTP301ou302deredirecionamentoparaaURLlongaoriginal [5]. Porexemplo, olinkhttp://topics.nytimes.com/top/news/business/companies/twitter/ pode ser en-curtadoparahttp://nyti.ms/1VKbrCpelobit.ly[3], queiraredirecionarqualquerrequisic aoparaostioWeboriginal.VIII Simpsio Brasileiro de Sistemas Colaborativos- 5 -Para estudarmos os principais domnios propagados noTwitter,precisamosobteraversaolongadetodasasURLsencurtadas encontradas emnossabase. Paraisso, desen-volvemosumaferramentacapazderesolveraURLdeumtweet,enviandoumarequisic aoaosistemaencurtadorere-solvendoaURL. Seodomnioobtidofossediferente, nosconsideramosaURLnotweetserumaURLencurtada,se-nao, consideramosaURLcomolonga. Foramencontrados30 servicos encurtadores de URL nos dados de usuarios bra-sileiros, sendo que os servicos tinyurl.com e bit.ly sao os maispopularescommaisde90%dototaldeURLsencurtadas.Twitter Domnio Alexa1 twitpic.com 472 blip.fm 26543 lolquiz.com -4 youtube.com 35 plurk.com 51416 .im -7 tumblr.com 348 ickr.com 369 twitter.com 1310 meadd.com 695Tabela3: Rankingdedomnios noTwitter esuasrespectivaspopularidadesnorankingdoalexa.comCom base nesses dados, podemos vericar se as URLs maiscompartilhadasporbrasileirosnoTwittersaoURLsdedo-mnios populares na Web brasileira. Como forma de compa-rac ao, noslistamososdomniosbrasileirosmaispopularessegundoostioWebalexa.com[1], quemedeon umerodeacessosrecebidospordiversosstiosweb. Atabela3apre-senta os domnios mais populares das URLs propagadas porbrasileiros noTwitter e suas respectivas posicoes noran-kingdoalexa.com. Deformasimilar, atabela4mostraorankingdosdomniosmaispopularesbrasileirossegundooalexa.comesuasrespectivasposicoesnorankingdosdom-niosmaispropagadosnoTwitter.Podemos fazer varias observac oes interessantes apartirdessas tabelas. O ranking do alexa.com e bastante diferentedorankingdosdomniospropagadosnoTwitter. Empar-ticular, odomniomais popular propagadonos tweets debrasileiros e o twitpic.com,um sistema para permite o com-partilhamento de fotos. No alexa.com, o stio web com maiorn umero de acessos e do Google, que aparece muito pouco nosdados doTwitter. Aoobservarmos os 100domnios maispopulares noTwitter notamos umapredomin anciadedo-mniosdestioswebassociadosanotcias,entretenimentoeredessociais. Apenasumstiowebdecomprasaparecenoranking, naposic ao97. Norankingdoalexa.com, alemderedessociais, encontramosumapredominanciadesistemasdebusca,servicoscomoostiodobancoIta unaposic ao23e ministerio da fazenda na posi c ao 41, alem de dezessete sis-temas de compra online, incluindo Mercado livre na posic ao17,buscapenaposicao30esubmarinonaposic ao34.7. USURIOS INFLUENTES NO BRASILUsuarios inuentes possuemumafunc aovital emqual-querecossistema,devido`aassocia c aodanoc aoinuencia`anoc aodepoderdeformaraopiniaodeoutraspessoas, afe-tandofuncionalidadesdasociedade,comoporexemplo,emquem eleitores votam [8] ou como uma determinada moda seespalha [13]. Apesar de amplamente estudada em diferentesAlexa Domnio Tweets1 google.com.br -2 google.com 783 youtube.com 44 facebook.com 655 uol.com.br -6 orkut.com.br 167 live.com -8 globo.com 119 blogspot.com -10 yahoo.com -Tabela 4: Ranking dos domnios no alexa.com e suasrespectivaspopularidadesnorankingdoTwitterareas, tais como sociologia, marketing e ciencia poltica [19],a no c ao de inuencia nunca foi quanticada nesses contextosporsetratardeumconceitovagoedifcil deserquanti-cado. Entretanto, comaenormepopularidadedoTwitter,varias ideias conitantes e algoritmos para a identica c ao deusuariosinuentesnoTwittervemsurgindo.V ariasmaquinasdebusca, incluindooGoogle, estimamaimportanciados tweets baseados noPageranknatenta-tivaderetornartweetsmais importantes comoresultadodebuscas[22]. OPageRankeumalgoritmointerativoqueassinalaumpesonumericoparacadanodocomopropositodeestimarsuaimportanciarelativanografo. Oalgoritmofoi inicialmentepropostoporBrinePage[9] paraordenarresultadosdebuscadoprot otipodemaquinadebuscadaGoogle. Aintuic aoportr asdoPageRank equeumusuariodoTwittereimportanteseexistemmuitos usuarios ose-guindoouexistemoutrosusuariosimportantesoseguindo.AequacaoquecalculaoPageRank(PR)deumusuarioi,PR(i),edenidadaseguinteforma:PR(i) = (1 d) +dXvS(i)PR(v)Nv(1)ondeS(i)eoconjuntodeusu ariosqueseguemi,Nvdeno-mina o n umero de arestas que saem do nodo v, e o parametrod e um fator que pode ter valor entre 0 e 1. Em nossos expe-rimentos, oPagerankfoi computadoparaografocompletodoTwitterenaosomenteparaosusu ariosbrasileiros,vistoqueousodeumaamostradografoparaoc alculodoPage-rankpodealterarsignicativamenteosresultados. Ovalordo par ametro d utilizado foi o valor padrao de 0,85, denidoem[9].Apesar de suaimensaaplicabilidade, oPagerankaindan ao foi rigorosamente vericado como metrica capaz de cap-turarosusu ariosmaisrelevantesdoTwitter. Algumasce-lebridades, comoBarackObama, saoseguidos por muitosusuarios, mas tambemos seguemde volta tornado essesusuarios importantes e, possivelmente afetando o uso doPagerankcomomedidade inuencia. Trabalhos recentesmostraramaexistenciadeumgranden umerodespammersnoTwitterqueatuamseguindoautomaticamentedeusua-rios noTwitter natentativadeser seguidodevoltaetersuainuenciaaumentada[7]. Alemdisso, Chaeseus co-laboradores[10]mostraramqueusuariosquepossuemmui-tosseguidoresnoTwitternaosaonecessariamenteusuariosmuitoretweetados. On umeroderetweets funcionacomoumindicadordahabilidadedeumusuariogerarconte udocomvalorsucienteparaserpassadoparaafrente. Algunsstioswebcompropositocomercial temganhadopopulari-VIII Simpsio Brasileiro de Sistemas Colaborativos- 6 -dade aoprover oRetweetrankde usuarios comuns, comoeocasodowww.retweetrank.com. Sendoassim, alemdoPagerank, vamos considerar comomedidade inuenciaoretweetRank,que eorankingdeusuariosmaisretweetados.Para isso, foi preciso compararmos cada tweet postado pelosusuariosbrasileiroscomostweetspostadosposteriormentepelosseusseguidoresnatentativadeidenticarpotenciaisretweets. Umretweetocorrequandoumusuariopostaumamensagemcomos seguintes padroes RT @[email protected] 10usuarios brasileiros mais bemranqueadosdeacordocomPagerankesuasrespectivaspo-sic oes de acordo como Retweetrank. De maneira seme-lhante, atabela6mostraorankingdosusuariosdeacordocomRetweetrankesuasrespectivasposic oesdeacordocomoPagerank. Podemosfazerinteressantesobservac oessobreessastabelas. Primeiro, podemosnotarqueousuariocommaiorPagerankeousuario@manomenezes, queeoperldoatualtecnicodaselecaobrasileiradefutebol,ManoMe-nezes.Entretanto, ousuariomaisretweetadoeojornalistaMarceloTas (@marcelotas), apresentador doprogramadetelevisaoCQC. Apesar demuitoseguido, otecnicoManoMenezesapareceapenasnaposic ao64dorankingdosmaisretweetados. De fato, usuarios do Twitter podem estar maisinteressadasemreceberemprimeiramaoasinformac oesdeumtecnicodefutebol,masnaonecessariamenterepassa-lasaos seus seguidores. Outraimportanteobservac aoerela-cionadaaogrande n umerode artistas brasileiros entre osmaisinuentes, especialmenteaquelesligadosaprogramasdehumor.Pagerank Usuario Retweetrank1 manomenezes 642 marcelotas 13 DaniloGentili 134 marcoluque 265 ivetesangalo 916 kibeloco 27 rodrigovesgo 208 christianpior 69 OscarFilho 2210 andreolifelipe 100Tabela5: Posi caodos10usuarioscommaiorPage-ranknorankingdoRetweetrankRetweetrank Usuario Pagerank1 marcelotas 22 kibeloco 63 rosana 124 Cardoso 585 melhoresfrases 176 christianpior 87 millorfernandes 158 esoterismo 2099 abduzeedo 3310 malvados 55Tabela 6: Posi cao dos 10 usuarios com maior Retwe-etranknorankingdoPagerankApesar de oferecer uma visao geral sobre os usuarios maisinuentes no brasil, nossas analises apontamusuarios datwitteresferabrasileiracommaior potencial deinuenciarumgranden umerodepessoas. Entretanto,inuenciapodevariardeacordocomasdiferentesregioesbrasileiras, espe-cialmente emumpas taovastocomooBrasil. De fato,empresasligadasaestrategiasdemarketingboca-a-bocanoBrasilpodemestarmaisinteressadasemidentifcarusuariosquesejaminuenteslocaisemdeterminadasregioesdoqueusuarios ja famosos na televisao e que sao consequentementepopularesnoTwitter.Comoformadeidenticartaisusuarios,aTabela7mos-tra os 10 usuarios mais inuentes de cada regiao do Brasil deacordocomoPagerankesuaposic aonorankinggeral. Demaneira similar, a Tabela 8 mostra os 10 usuarios mais inu-entes de cada regiao do Brasil de acordo com o Retweetranke suaposic aonorankinggeral. Note que alemdas cele-bridades, amaioriaconcentradanaregiaosudeste, nossasrankings de usuarios inuentes reveleram a existencia de in-uentes locais em diversas regioes. Como exemplo, o usuario@diariodopara, naregiaonorteaparecenaposi c ao1505noranking brasileiro do Pagerank, mas e o decimo usuario maisinuentedetodaaregi aoNorte, tendoumaatua c aoaindamais importante no estado do Para. Ja no caso deretweets,ousuario@Cardososemostroumaisretweetadoatemesmodoqueousuario@marcelotas naregiaonordeste, queapa-rece em primeiro lugar nos demais estados. Tais observac oessugerem que algumas regioes podem possuir inuentes locaisque,dependendodaregiao,podemrepresentarumamelhorop c aoparaarealiza c aodeumaac aodemarketingepropa-ganda.8. CONCLUSESEste trabalho apresenta uma ampla an alise geograca dosusuarios brasileiros no Twitter e de seus tweets. Nossasan alisesrevelamquealgunsestadosbrasileirosestaosubes-timadosnoTwitteremrelacaoadadosdemogracos,sendoque caractersticas socio-economicas desses estados pareceminuenciarnon umerodeusuariosdoTwitter. Alemdisso,nossas analises aindarevelampadroes lingusticos associa-dosaousodemicroblogsnoBrasil, identicandopalavrasgeralmenteassociadasacontextosfelizesetristes. NossasanalisesrevelamasURLsmaispostadasporbrasileirosnoTwitter emostraqueessas naos aoas mais acessadas naweb demaneira geral. Por ultimo,identicamosos usuariosbrasileiros mais inuentes noTwitter e mostramos que orankingdeinuenciavariaemdiferentesregioesbrasileiras.Como ultimacontribui c ao, caberessaltarqueametodolo-giaaquiempregadaemdiversasanalisespodeguiarfuturasanalisesrelacionadasaoTwitter.Como trabalhos futuros, pretendemos desenvolver umaferramentadebusca,deformaapermitirqueusuarioswebpossam extrair informac oes de nossa base de dados. Em ou-tras palavras pretende-se desenvolver as bases de um sistemaque permita que interessados possam entender a repercussaoeaopiniaodeusuariosdoTwittersobreeventosocorridosno passado em diferentes localizac oes geogracas. Exemplosdecen ariosqueesperamosidenticarcomessaferramentasao: (i)epidemiadedengueafetanegativamenteohumordas pessoas, ondepelanuvemdetags poderemos ver no-meseentidadescriticadas; (ii)avitoriadoRiodeJaneirocomosededas Olimpadas de2016causouenormealegriaaosbrasileiros; vitoriadeumdeterminadotimedefutebolgera alegria em uma regiao e infelicidade em outra; (iii) quaisasregioesreceberampositivamente/negativamenteolanca-mentodeumnovoproduto.VIII Simpsio Brasileiro de Sistemas Colaborativos- 7 -TopNorte TopNordeste TopCentro-oeste TopSudeste TopSulDiscoLee(151) ivetesangalo(5) bfeneto(18) manomenezes(1) abduzeedo(33)talivale(767) sigacl(30) passagensaereas(37) marcelotas(2) federicodevito(43)jerilsonduarte(836) comunicadores(66) WelderMM(62) DaniloGentili(3) piangers(46)DEZMinutos(903) murilogun(96) oabbrasil(167) marcoluque(4) garotasemo(75)educhaves(1051) gilbertogil(124) consumidorgov(227) kibeloco(6) lucasfresno(82)asttro(1093) scheilacarvalho(138) brazilians(238) rodrigovesgo(7) nanypeople(91)joaopedrosenado(1122) mcamelo(168) agenciabrasil(301) christianpior(8) bobagento(102)jenizambiazzi(1255) LisiSilveira(187) AlonFeuerwerker(431) OscarFilho(9) azaghal(106)pedrox(1451) Danosse(230) jorgeemateus(450) andreolifelipe(10) laumundial(102)diariodopara(1505) veramartins(248) comediamm(464) oceara(11) anderssauro(164)Tabela7: TopinuentesdecadaregiaodeacordocomoPagerankesuaposicaonorankinggeralTopNorte TopNordeste TopCentro-oeste TopSudeste TopSulpedrox(306) Cardoso(4) marcelotas(1) marcelotas(1) marcelotas(1)Cardoso(4) marcelotas(1) kibeloco(2) rosana(3) Cardoso(4)kibeloco(2) rosana(3) Cardoso(4) kibeloco(2) kibeloco(2)marcelotas(1) kibeloco(2) rosana(3) Cardoso(4) rosana(3)rosana(3) melhoresfrases(5) melhoresfrases(5) melhoresfrases(5) millorfernandes(7)diariodopara(838) christianpior(6) christianpior(6) christianpior(6) melhoresfrases(5)melhoresfrases(5) millorfernandes(7) millorfernandes(7) millorfernandes(7) tplayer(25)christianpior(6) comunicadores(11) inagaki(15) malvados(10) tiagomx(103)millorfernandes(7) malvados(10) malvados(10) esoterismo(8) christianpior(6)paolelli(1022) inagaki(15) samara7days(16) comunicadores(11) malvados(10)Tabela8: TopinuentesdecadaregiaodeacordocomoRetweetrankesuaposicaonorankinggeral9. AGRADECIMENTOSOpresente trabalhofoi realizadocomoapoiodoUOL(www.uol.com.br), atraves do Programa UOLBolsa Pes-quisa,processon umero20110210152501.10. REFERNCIAS[1] Alexa,thewebinformationcompany.http://www.alexa.com.AccessedinMarch/2010.[2] Arquivosdoibge.http://www.ibge.gov.br/servidorarquivosest.[3] Bit.ly.http://www.bit.ly.[4] ThereAreNow155mTweetsPostedPerDay,TripletheNumberaYearAgo.http://rww.to/gv4VqA,April2011.[5] D.Antoniades,I.Polakis,G.Kontaxis,E.Athanasopoulos,S.Ionnadis,E.P.Markatos,andT.Karagiannis.we.b: ThewebofshortURLs.InIntl WorldWideWebConference(WWW),2011.[6] F. Benevenuto,J. Almeida,and A. Silva. Coleta e analise degrandesbasesdedadosderedessociaisonline.InJornadasdeAtualiza c aoemInform atica(JAI),pages1157.2011.[7] F.Benevenuto,G.Magno,T.Rodrigues,andV.Almeida.Detectingspammersontwitter.InAnnual Collaboration,Electronicmessaging,Anti-AbuseandSpamConference(CEAS),2010.[8] J.BerryandE.Keller.TheInuentials: OneAmericaninTenTellstheOtherNineHowtoVote,WheretoEat,andWhattoBuy.FreePress,2003.[9] S.BrinandL.Page.Theanatomyofalarge-scalehypertextualwebsearchengine.ComputerNetworksandISDNSystems,30(1-7):107117,1998.[10] M.Cha,H.Haddadi,F.Benevenuto,andK.Gummadi.MeasuringUserInuenceinTwitter: TheMillionFollowerFallacy.InIntl AAAIConferenceonWeblogsandSocialMedia(ICWSM),2010.[11] S.Chhabra,A.Aggarwal,F.Benevenuto,andP.Kumaraguru.Phi.sh/$ocial: Thephishinglandscapethroughshorturls.InAnnual Collaboration,Electronicmessaging,Anti-AbuseandSpamConference(CEAS),2011.[12] comScore.Thenetherlandsranksnumber1worldwideinpenetrationfortwitterandlinkedin.http://bit.ly/hOpdAb,2011.[13] M.Gladwell.TheTippingPoint: HowLittleThingsCanMakeaBigDierence.BackBayBooks,2002.[14] J.Gomide,A.Veloso,W.M.Jr.,V.Almeida,F.Benevenuto,F.Ferraz,andM.Teixeira.Denguesurveillancebasedonacomputationalmodelofspatio-temporallocalityoftwitter.InACMSIGWEBWebScienceConference(WebSci),2011.[15] GoogleGeocodingAPI.http://code.google.com/intl/en/apis/maps/documentation/geocoding/.[16] H.Kwak,C.Lee,H.Park,andS.Moon.Whatistwitter,asocialnetworkoranewsmedia?InIntl WorldWideWebConference(WWW),pages591600,2010.[17] K.Lee,B.Eo,andJ.Caverlee.Sevenmonthswiththedevils: Along-termstudyofcontentpollutersontwitter.InIntl AAAIConferenceonWeblogsandSocial Media(ICWSM),2011.[18] T.Rodrigues,F.Benevenuto,M.Cha,K.P.Gummadi,andV.Almeida.Onword-of-mouthbaseddiscoveryoftheweb.InACMSIGCOMMInternetMeasurementConference(IMC),2011.[19] E.M.Rogers.DiusionofInnovations.FreePress,1962.[20] T.Sakaki,M.Okazaki,andY.Matsuo.Earthquakeshakestwitterusers: real-timeeventdetectionbysocialsensors.InWWW10: Proceedingsofthe19thinternationalconferenceonWorldwideweb,pages851860,2010.[21] S.Scellato,C.Mascolo,M.Musolesi,andJ.Crowcroft.TrackGlobally,DeliverLocally: ImprovingContentDeliveryNetworksbyTrackingGeographicSocialCascades.InIntl WorldWideWebConference(WWW),2011.[22] D.Talbot.HowGoogleRanksTweets.http://www.technologyreview.in/web/24353/,Jan2010.[23] T.N.Y.Times.GoogleAddsLiveUpdatestoResults,December2009.http://nyti.ms/cnszI5.[24] A.Tumasjan,T.Sprenger,P.Sandner,andI.Welpe.Predictingelectionswithtwitter: What140charactersrevealaboutpoliticalsentiment.2010.[25] L.Rao,TwitterSeeing90MillionTweetsPerDay,25PercentContainLinks,TechCrunch,2010.http://tinyurl.com/27x5cay.VIII Simpsio Brasileiro de Sistemas Colaborativos- 8 -Uma Investigao sobre os Assuntos do Momento e a Discusso de Notcias no Servio de Microblogging Twitter Karen da Silva FigueiredoAna Cristina Bicharra Garcia Instituto de Computao (IC)Universidade Federal Fluminense (UFF)Rio de Janeiro, Brasil [email protected] Instituto de Computao (IC)Universidade Federal Fluminense (UFF)Rio de Janeiro, Brasil [email protected] ABSTRACTMicroblogging services like Twitter are a great opportunity oIresearch to study patterns oI social interaction, given that, everyday,thosesystemsreachthousandsoIuserswhoshareandspreadinIormation through the network. In this paper we present aninvestigation on the most commented topics on Twitter, calledTrend Topics, in order to identiIy: the real-world events whichthesetopicsarediscussing,thecompositionoIthemessagesaboutthese topics, and the relationship between these topics and thenews Irom the online news medias. The analysis was perIormedon a sample oI more than 500 000 tweets, 530 trend topics andmorethan3900newscollectedduringoneweek.CategoriesandSubjectDescriptorsH.5.3 |Information Interfaces and Presentation|: Group andOrganization InterIacescollaborative computing, web-baseainteraction.GeneralTermsMeasurement,HumanFactors.KeywordsTwitter, Microbbloging, Online social network, InIormationdiIIusion,NewsdiIIusion,TrendTopics.RESUMOServios de microblogging como o Twitter so excelentesoportunidades para pesquisas de padres sociais de interao,tendoemvistaquetodososdiasestessistemasalcanammilharesdeusuariosquecompartilhamedivulgaminIormaesatravsdarede. O presente trabalho apresenta uma investigao sobre osassuntos mais comentados no servio de microblogging Twitter,denominados'AssuntosdoMomento,aIimdecompreender do que se tratam tais assuntos, i.e. a quais eventos do mundo realestes assuntos esto relacionados, quais as caracteristicas dasmensagens sobre estes assuntos e qual a relao entre estesassuntos e as noticias divulgadas online. A realizao da analiseIoi executada em uma amostra de mais de 500 mil tweets, 530'AssuntosdoMomentoemaisde3900noticiascoletados duranteumasemana.

CategoriaseDescritoresdeAssuntosH.5.3|InterfacesdeInformaoeApresentao|:InterIacesdeGrupo e Organizaocomputao colaborativa, interaobaseaaaemweb.TermosGeraisMedio,FatoresHumanos.Palavras-chaveTwitter, Microbbloging, Redes sociais online, DiIuso deInIormaes,DiIusodenoticias,AssuntosdoMomento.1.INTRODUOServios de microblogging e redes sociaiselevaramasIormasdecomunicao mediadas por computador a um novo patamar,tornando-se alvos de pesquisas por oIerecem uma excelenteoportunidade para estudar padres sociais de interao tendo emvista que estes sistemas alcanam milhares de usuarios todos osdias.Osserviosdemicrobloggingpermitemqueusuariosdivulguemecompartilhem inIormaes sobre as suas atividades, opinies estatus|1|.EntrevariosdestesserviosdemicrobloggingtalvezoTwitter |2| seja o mais popular atualmente. Alm de ser ummicroblogging que oIerece suporte a criao de conteudos pelousuario(comumlimitede140caracteres),tambmconstituiumaredesocialpoispermiteaosseususuariosseguiremaspaginasdeconteudos de outros usuarios (e tenham suas paginas seguidas),criandovinculosentreestes.Algumasdaspesquisasquetmsidodesenvolvidasnodominiodemicroblogging, analisam o Twitter a Iim de entender comoocorrem: (i) a criao de conteudos pelos usuarios |1|; (ii) asrelaesdeamizadenarede|3|,|4|;(iii)aIormaodeconversase processos colaborativos |3|, |5|, |6|; e (iv) a propagao deinIormaesdentrodarede|4|,|7|,|8|.EsobovisdapropagaodeinIormaesnaredequeopresentetrabalhoestalocalizado.Oobjetivodestapesquisainvestigar:(i)quaissoosassuntosmaiscomentadospelosusuariosnoTwitter;(ii) a quais eventos do mundo real estes assuntos estorelacionados; (iii) quais as caracteristicas das mensagens sobreestes assuntos; e (iv) qual a aIinidade entre estes assuntos e asnoticiasdivulgadasonline.VIII Simpsio Brasileiro de Sistemas Colaborativos- 9 -A partir dessa seo, o restante deste artigo esta organizado daseguinte Iorma: na Seo 2 o Twitter e suas principaiscaracteristicas so apresentadas; na Seo 3 alguns trabalhosrelacionados so brevemente tratados; na Seo 4 o processo deinvestigao da pesquisa detalho, nela so descritos acoletadedados e os resultados obtidos; e na Seo 5 as concluses etrabalhosIuturossodiscutidos.2.OTWITTERESUASCARACTERISTICASO Twitter, como dito anteriormente, tanto um servio demicroblogging, quanto uma rede social. E um sistemacolaborativo|6|queoIerecesuporteacriaodeconteudospelosseususuariosquandoosmesmosrespondemaperguntaexibidanapaginainicialdosistema:'Oqueestaacontecendo?.Esta respostadeveternomaximo140caracteresedenominadatweet.Oconjuntodetweetsproduzidosporumusuarioconstituemasualinha do tempo que disponibilizada para todos em sua pagina,caso o usuario permita. Usuarios podem seguir as paginas deoutros usuarios e, a partir de ento, os primeiros comeam areceberostweetsdosusuariosseguidosdiretamentenasuapaginainicial.Oquestionamentoconstantedaperguntaexibidanapaginainiciale o limite de 140 caracteres incentivam uma Irequncia maior deproduo de conteudo pelo usuario e a disponibilidade de umaverso mobile do sistema Iacilita ainda mais o compartilhamentodeinIormaesemtemporeal.O servio tambm possui caracteristicas peculiares que o tornammais atrativo e Iacilitam a diIuso deconteudonarede.Algumasdestascaracteristicassolistadasedescritasaseguir:xMenes: um usuario pode citar outro usuarioemseu tweetatravs de uma meno. Essa meno Ieita utilizando osimbolodeseguidodonomedousuarioasermencionado.A meno pode ser utilizada como uma Ierramenta parachamar a ateno de um usuario para o conteudodo tweeteparainiciarconversasentreosusuariosnarede|6|.xRetweets: caso um usuario considere interessante o tweetdeoutro usuario ele pode utilizar este tipo especial de menochamadoretweet.Atravsdoretweetousuariocompartilhaoconteudo do tweet de outro usuario com os seus seguidoresmantendo o crdito do seu produtor. O retweet pode serrealizado de Iorma automatica atravs da IuncionalidadeRetweetar do sistema, ou de Iorma manual caracterizadogeralmentecomum'RTnoiniciodamensagemseguido pela meno e pelo tweet original do usuario Ionte.OutrasIormasderetweetssodiscutidasem|9|.xHashtags:umusuariopodedestacarumtermoemseutweetpreIixando-ocomosimbolo'#.Termosdestacadosdesta Iorma so conhecidos como hashtags e so utilizados comoumaIormadeindicaroteordoconteudodotweet.OTwittergeraumlinkparacadahashtagque,aoserselecionado,levaa uma busca que tem como resultado os ultimos tweets detodososusuariosdaredequecontenhamotermodahashtag.xAssuntos do Momento (1rend 1opics, em ingls): napaginainicialdecadausuarioexibidaumalistaquecontmos 10 termos mais comentados em todos os tweets ou nostweets de usuarios de determinada regio (escolhida pelousuario).Taistermosdenominadoscomo'Assuntosdo Momentopodemserhashtags ou uma sequncia depalavrasiniciadascomletrasmaiusculas.Cadatermodalistade'AssuntosdoMomentoIuncionacomoumatalhopara uma busca que retorna como resultado os ultimos tweets detodososusuariosdaredequecontenhamaqueletermo.xBusca e operadores de busca: o Twitter oIerece umaIerramenta de busca que pode apresentar como resultadospara o termo de entrada: ultimos tweets, imagens e videosdivulgadosatravsdeURLsnostweetseusuarios.Umasriede operadores pode ser usada em conjunto com o termodesejado na entrada para reIinar os resultados da busca, taiscomo: operadores de localidade, operadores de idioma,operadorestemporais,etc.xOperadores de atitudes: compem um subconjunto dosoperadores de busca que reIinam os resultados do termo deentrada.Soestesoperadores:':)e':(.Ooperador':) Iiltra os resultados exibindo apenas tweets com uma atitudepositiva em relao a entrada da busca. De Iorma oposta, ooperador ':( exibe os tweetsresultantesqueexpressemumaatitudenegativaemrelaoaentradadabusca.As caracteristicas apresentadas tornam a navegao na rede e acomunicao entre os usuarios mais dinmica, motivando ocompartilhamento de inIormaes e opinies como jademonstrado em |1| e |4|. O presente trabalho tem como Ioco aanalisedos'AssuntosdoMomentoeascaracteristicasdos tweetsrelacionadosaestesassuntos:numerodemenes,numeroderetweets,numerodeURLsequantidadedeatitudespositivasenegativas.3.TRABALHOSRELACIONADOSEm |1| o primeiro estudo sobre as propriedades topologicas egeograIicas do servio de microblogging Twitter Ioi executado.Os autores analisaram as intenes dos usuarios e a tendncia deusuarios com intenes similares de se conectarem. E, ainda em|1|, os autores classiIicaram os usuarios da rede em trs tiposprincipais: Iontes de inIormaes, amigos e buscadores deinIormaes. Esta classiIicao conIirma que os usuarios doTwitterenxergamaredecomoumconcentradordeinIormaes.Outra caracteristica de |1| Ioi a utilizao de um mtodo paracalcular quais termos eram os mais comentados durantedeterminado dia da semana,algomuitosimilaraos'Assuntosdo Momento.Napocadapesquisa|1|aindanoexistaa Iuncionalidade'AssuntosdoMomentonoTwitter1. Uma vezcalculadosostermosmaiscomentados,osautoresclassiIicaramostermosemtrscategorias:'Programasde TV, 'Eventos Atuais e'Atividades. Uma abordagem semelhante a esta categorizaodotrabalho|1|realizadanesteartigonaSeo4.Em |6| o aspecto colaborativo do Twitter Ioi observado com oobjetivodedeterminaroquantoassuasIuncionalidadesIacilitama troca de inIormaes entre usuarios. No Iinal do trabalho sodiscutidas modiIicaes de aesign que tornariam o Twitter umaIerramenta melhor para colaborao. Metade destas modiIicaesapontadas pelos autores de |6| ja esto disponiveis na redeatualmente, dentre elas aIuncionalidadedebuscamencionadanaSeo 2, essencial para a elaborao deste trabalho (veja maisdetalhesnaSeo4).

1A Iuncionalidade 'Assuntos do Momento surgiu em 2008.VIII Simpsio Brasileiro de Sistemas Colaborativos- 10 -Kwak et al. |4| tambm apresentaumaanalisedascaracteristicastopologicas do Twitter, porm com enIoque no poder da rede decompartilhar inIormaes. O estudo trata do comportamentotemporaldos'AssuntosdoMomentoedapropagaode inIormaes atravs de sequncias de retweets. Alm disso, osautorescomparamostermosdalistade'Assuntosdo Momento com os termos do Google Trena e as manchetes da rede CNN.Entretanto, no so relatados dados reIerentes a comparao dos'AssuntosdoMomentocomaCNN,aunicainIormao discutida no artigo a de que a CNN estaria em mais da metadedasvezesaIrentenadivulgaodenoticiasdoqueoTwitter.Trabalhos sobre a propagao de inIormaes semelhantes a |4|Ioram executados previamente em outras redes sociais |10| eserviosdeblogging|11|.Entretanto,atondedoconhecimentodosautoresdopresenteartigo,noexistemtrabalhosrelacionadosadiscussodenoticiasnestessistemasounoTwitter.4.OPROCESSODEINVESTIGAONestaseooprocessodeinvestigaorealizadoaIimdeanalisaros 'Assuntos do Momento e a discusso de noticias no Twitterdetalhado. Esta investigao tem como objetivos identiIicar: (i)quaissoosassuntosmaiscomentadospelosusuariosnoTwitter;(ii) quais eventos do mundo real esto relacionados a estesassuntos; (iii) quais assuntos esto relacionados as noticiasdivulgadas online; (iv) quais as caracteristicas das mensagenssobre os assuntos mais comentados, especialmente sobre osassuntosidentiIicadosnoitem(iii).Na Seo 4.1 o mtodo utilizado para a coleta dos dados descritoenaSeo4.2osresultadosobtidossodiscutidos.4.1AColetadosDadosParaacoletadosdadosIoidesenvolvidoumwebcrawleremJava|12|utilizandoasbibliotecasTwitter4J|13|paraaconexocomoTwittereROME|14|paraaconexocomcentraisdenoticias.A cada cinco minutos o web crawler copiava a lista dos atuais'AssuntosdoMomento2 do Twitter e realizava trs buscas paracada um desses assuntos, copiando tambm os seus resultados.Foram utilizadas como entradas para os trs tipos de busca: (i) otermodoassunto;(ii)otermodoassuntoseguidodooperadordeatitudes positivas;e(iii)otermodoassuntoseguidodooperadordeatitudesnegativas.Na mesma periodicidade de cinco minutos, Ioram coletadasmanchetes e datas de publicao de noticias de trs centrais denoticiasonline3.AcoletadedadosIoiexecutadaentreosdias18e24dejunhode2011, constituindo um intervalo de sete dias (uma semana).

2A lista de 'Assuntos do Momento determinada regionalmente pelo Twitter. A lista coletada neste trabalho Ioi a lista de'AssuntosdoMomentodaregio:23424768'Bra:il Country.3As centrais de noticias escolhidas para este trabalho Ioram G1|15|, R7 |16| e Google Noticias Brasil |17|. A escolha destascentraisIoideterminadapelapopularidadedasduasprimeirasepelo Iato da ultima apresentar uma coletnea das principaiscentraisdoBrasil.Durante este periodo Ioram coletados mais de 500 mil tweets4,530 'Assuntos do Momento e mais de 3900 noticias.Devidoagrandequantidadededadoscoletados,Ioramanalisadosneste estudo somente os 10 'AssuntosdoMomentodecada dia que permaneceram por mais tempo na lista de assuntos, e seusrespectivos resultados de busca, totalizando 70 'Assuntosdo Momento emaisde306miltweets.4.2ApresentaoeDiscussodosResultados4.2.1,GHQWLILFDomRH&DWHJRUL]DomRGRV$VVXQWRVGR0RPHQWRConIorme descrito na Seo 3, em |1| Ioi utilizado um mtodopara calcular quais termos eram os mais comentados durantedeterminado dia da semana e, apos calculados, os termos maiscomentadosIoramclassiIicadosem trs categorias: 'Programas de TV, 'Eventos Atuais e 'Atividades.DeIormasemelhanteaotrabalho|1|,nestaseoos 'Assuntos do Momento coletadosIoramclassiIicadosemcategoriasdescritasaseguir a Iim de compreender melhor os assuntos que so maisdebatidosnoTwitter.OsresultadossoapresentadosnasTabelas1e2.xEventos Atuais: assuntos relacionados a acontecimentos dodia.xEventos Passados: assuntos relacionados a acontecimentosdediasanteriores.xEventosFuturos:assuntosrelacionadosaacontecimentosdediasIuturos.xProgramas de TV: assuntos relacionados a programas deTVdomomento.xEsportes: assuntos relacionados a eventos esportivos domomento.xCrassroots o termo no tem uma traduo direta para oportugusesereIereamovimentospopularesquesurgemdeIorma natural e espontnea. ClassiIicou-se como grassrootsassuntosrelacionadosaestestiposdemovimentospopulares,como brincadeiras (e.g. #Iollowgeral), maniIestaes (e.g.#euescolhiesperar),etc.NaTabela1soapontadosos10'AssuntosdoMomentode cada dia da semana analisada que permaneceram por maistempona lista de assuntos5. Cada assunto da Tabela 1 Ioi identiIicadocom uma cor que representa a sua categoria a Iim de Iacilitar aleitura da tabela considerando a quantidade de entradas, porexemplo, a cor laranja indica que um assunto da categoria'Esportes.

4ComooIocodesteartigonoadetecodespam,optamosporadotaratcnicadeeliminaodetweetsquecontinhammaisdoquetrs'Assuntos do Momento na mesma mensagem,tcnicatambmutilizadaem|4|.5A lista completa de 'Assuntos do Momento coletados durante a semanacomosseusrespectivostemposdepermanncianalistade assuntos esta disponivel em: http://www.ic.uII.br/~kIigueiredo/tresearch/assuntos.pdIVIII Simpsio Brasileiro de Sistemas Colaborativos- 11 -Tabela1.AssuntosdoMomentoesuasCategoriasLegenda:

EventosAtuaisEventosPassadosEventosFuturosProgramasdeTVEsportes"Crassroots"Posio Sbado Domingo1 SoniaBraga #chicolatrasday2 UndisclosedDesires #saojoaodonordeste3 DeborahBlando Joe&Nick4 #uIc134 FallingSkies5 #sigavelhostempos StevenSeagal6 #plantaeraiz DragonballEvolution7 SNZ #RogerioCeni8 #ZeGotinha PapaiJoel9 LeandraLeal BetoBarbosa10 #maislegalquetvxuxa WerdumPosio Segunda-feira Tera-feira1 GAGAWON #euescolhiesperar2 #bancodeseguidores #twitter33 RyanDunn WilzaCarla4 MarthaRocha KellyKelly5 #cidadedoshomens SkolSensations6 EvangelineLilly DakotaFanning7 FallingSkies MovesLikeJagger8 #oprecodeumalicao #herois9 3YearsCampRock RyanDunn10 Jackass CarlaDiazPosio Quarta-feira Quinta-feira1 Phineas&Ferb OrgulhoPeLanza2 #Ieriadao #SantosCampeao3 GarotaInIernal KleberMachado4 EnriqueIglesias FerrisBueller5 OrgulhoHetero #zelove6 #Iollowgeral #curtindoavidaadoidado7 AlianzaLima Phineas&Ferb8 IWannaGodney Uruguaios9 #dianacionaldovexame RodrigoSantana10 CorpusChristi StellaFlorencePosio Sexta-feira 1 #palmeirasminhavida 2 CapitoAmrica 3 TeamFortress 4 OrgulhoPeLanza 5 PadreJuarez 6 #billboardawards 7 #uiquilics Posio Sexta-feira 8 SnoopDog 9 IBGE 10 #boladay

Tabela2.AnliseQuantitativadasCategoriasCategoriaNmerode$VVXQWRVGR0RPHQWR PercentualEventosAtuais 18 25,71EventosPassados 2 2,86EventosFuturos 2 2,86ProgramasdeTV 21 30Esportes 7 10'Grassroots 14 20NoidentiIicada 6 8,57Total 70 100,00

ATabela2apontaaquantidadede'AssuntosdoMomentode cada categoria de acordo com a classiIicao Ieita na Tabela 1.Como se pode observar na Tabela 2, os programas de TV so osassuntos mais comentados no Twitter, ocupando 30 dos'AssuntosdoMomentoda semana analisada. Em seguida, esto oseventosatuais(25,71)eosgrassroots(20).Os grassroots no Twitter so to importantes que, se a mesmacategorizao utilizada neste trabalho Ior aplicada para ashashtags retweetadas mais populares apresentadas em |18|, opercentualdehashtagsda categoria 'Grassroots chega a 70.AposclassiIicado,cadatermodos'AssuntosdoMomentoda Tabela 1 Ioi buscado entre as 3900 manchetes de noticias. Os'AssuntosdoMomentosublinhadosnaTabela1reIerem-se aassuntosqueobtiveramresultadosduranteestabusca.

Tabela3.PrimeirasOcorrnciasdosAssuntosdoMomentonoTwitterenasCentraisdeNotciasAssunto1ocorrncianos"AssuntosdoMomento"1ocorrncianasNotcias#Ieriadao 22/06as10:36h 22/06as06:00h#RogerioCeni 19/06as16:31h 19/06as18:02h#SantosCampeao 22/06as23:57h 23/06as08:38h#ZeGotinha 18/06as11:16h 18/06as06:00hCapitoAmrica 23/06as21:24h 23/06as21:08hCorpusChristi 22/06as08:48h 22/06as06:00hIBGE 24/06as08:04h 24/06as04:03hJackass 20/06as12:15h 21/06as11:00hOrgulhoHetero 22/06as12:34h 22/06as13:02hRyanDunn 20/06as11:39h 21/06as11:00hWilzaCarla 20/06as21:24h 21/06as00:20hVIII Simpsio Brasileiro de Sistemas Colaborativos- 12 -Comparou-seentoadatadepublicaodanoticiacomadatadeatualizaodoTwitterdalistade'AssuntosdoMomentoque continha o assunto reIerido. Os resultados so apresentados naTabela3.Nota-se que apenas 15,71 dos assuntos mais comentados noTwitteraparecemnasnoticias,sendo63,64sobreeventosatuaise18,18sobreesportes.AsocorrnciassublinhadasnaTabela3destacamaprimeiraocorrnciageraldoassunto.De acordo com as ocorrncias sublinhadas na Tabela 3, 54,55dos assuntos analisados Ioram comentados no Twitter antes dasnoticias serem publicadas, e esse numero sobe para 100 emassuntosdacategoria'Esportes.UmmotivoquepodejustiIicar este resultado o Iato dos eventos esportivos seremacompanhados em tempo real pelos usuarios, e assim, seremdiscutidosnaredeenquantoaindaestoacontecendo.Osassuntos'RyanDunn,'Jackasse'WilzaCarlatambm apareceram primeiro no Twitter, estando estes relacionados aoIalecimento de celebridades. Como a vida de celebridadescostuma ser acompanhada pelos seus Is, talvez isso explique asprimeirasocorrnciasdessesassuntosnoTwitter.4.2.2,GHQWLILFDomRH&DWHJRUL]DomRGRV$VVXQWRVGR0RPHQWRCom o objetivo de analisar as caracteristicas da composio dostweets coletadosnasbuscasdos'AssuntosdoMomentoIoram calculadasasseguintestaxasparacadaassunto6:xTaxa de Retweets: porcentagem de tweets que so retweetsnototaldetweetscoletado.xTaxa de Menes: porcentagem de tweets que Iazemmenesaoutrosusuariosnototaldetweetscoletado.xTaxadeURLs:porcentagemdetweetsquecontmURLsnototaldetweetscoletado.xTaxa de Atitudes Positivas/Negativas: porcentagem detweetsqueapresentamumaatitudepositiva/negativanototalde tweets coletados atravs das buscas com operadores deatitudes.AsmdiasdastaxascalculadasparacadaassuntosoindicadasnaTabela4.

Tabela4.MdiadasTaxasdosAssuntosdoMomentoTaxa ValorMdioTaxadeRetweets 23,32TaxadeMenes 41,65TaxadeURLs 12,29TaxadeAtitudesPositivas 65,43TaxadeAtitudesNegativas 34,57

6 A tabela geral contendo todos os assuntos e suas respectivastaxas esta disponivel em http://www.ic.uII.br/~kIigueiredo/tresearch/taxasDosAssuntos.pdIAs taxas de atitudes positivas e atitudes negativas somam 100dos tweets coletados. Um tweet sempre classiIicado comopossuindo ou uma atitude positiva ou uma atitude negativa peloTwitter. Ja as taxas de retweets, menes e URLs no somutuamenteexclusivaseportantonototalizam100dostweetscoletados. Um tweet pode ser ao mesmo tempo uma meno,umretweeteconterumaURL,bemcomopodenopossuirnenhumadessascaracteristicas.Emmdiaataxademenesde41,65,sendoumpoucomaisdametadedestasdotiporetweet(23,32dototal).Estevalordataxa de menes um pouco maior do que valor obtido em |6|,que Ioi de 30. No trabalho |6|, Ioram medidas as menes detodos os tweets, nosomenteosrelacionadosaos'Assuntosdo Momentooquepodeindicarqueosusuariostrocammais mensagens com os outros sobre os assuntos mais populares narede. Ja o valor da mdia da taxa de URLs bem proximo aovalores de 13 e 19 indicados por Java et al. em |1| e Zarellaem|19|respectivamente.Com relao as mdias das taxas de atitudes positivas/negativas,pode-se observar que em sua maioria (65,43) aatitudepositivados usuarios sobre os 'Assuntosdo Momento prevalece.NaTabela5so ilustrados os valores das taxas para os 'Assuntos doMomentoque apareceram em noticias, listados previamentenaTabela3.

Tabela5.TaxasdosAssuntosdoMomentoNoticiadosAssunto

Taxa

de

Retweets

Taxa

de

Menes

Taxa

de

URLs

Taxa

de

Atitudes

Positivas

Taxa

de

Atitudes

Negativas

#Ieriadao 11,75 19,12 3,69 55,38 44,62#RogerioCeni 25,71 35,73 2,89 91,10 8,90#SantosCampeao 22,96 40,04 2,30 58,57 41,43#ZeGotinha 16,39 32,59 3,08 53,39 46,61CapitoAmrica 10,80 24,90 21,12 82,11 17,89CorpusChristi 20,42 44,03 20,06 49,42 50,58IBGE 22,40 45,40 53,77 85,57 14,43Jackass 40,33 63,11 17,03 50,62 49,38OrgulhoHetero 42,49 54,24 7,27 53,93 46,07RyanDunn 53,38 65,16 13,97 45,79 54,21WilzaCarla 36,48 43,14 35,62 19,56 80,44ValorMdio 27,56 42,50 16,44 58,68 41,32

Comopode-senotarovalormdiodataxademenesparaestesassuntos se manteve bem proximo do valor mdio geral.Entretanto,possivelperceberumpequenoaumentocomrelaoastaxasderetweets(27,56)eURLs(16,44).Outros pontos interessantes revelados na Tabela 5, so: (i) osassuntos da categoria 'Esportes tm a menor taxa de URLs, emmdia 2,59, provavelmente pelo Iato dos eventos esportivosseremacompanhadosemtemporealpelosusuariosquedevemtermenor interesse na divulgao de URLs nesse momento; (ii) osassuntos que Ioram comentados primeiramente no Twitter tmasmaiores taxas de retweets o que pode indicar o intuito dosVIII Simpsio Brasileiro de Sistemas Colaborativos- 13 -usuariosdepropagaremessesassuntospelarede;e(iii)asnoticiasrelacionadas ao Ialecimento decelebridadestmasmaiorestaxasde atitudes negativas, por motivos obvios, contrariando atendncia geral dos assuntos mais comentados de terem umamaiortaxadeatitudespositivas.5.CONCLUSOETRABALHOSFUTUROSO presente trabalho apresentou uma analise sobre os assuntosmais comentados no servio de microblogging Twitter,denominados'AssuntosdoMomento,aIimdecompreender do que se tratam tais assuntos, i.e. a quais eventos do mundo realestes assuntos esto relacionados. Para tanto, realizou-se umacategorizaodos'AssuntosdoMomentoeapartirdela, pode-seobservarqueostopicosqueosusuariosdaredemaiscomentamso os programas de TV e eventos que acontecem no dia,seguidos dos grassroots que so movimentos popularesgeralmente iniciados na propria rede, como brincadeiras,maniIestaes,homenagens,etc.Almdacategorizaodos'AssuntosdoMomento,osassuntos coletados tambm Ioram comparados com as manchetes decentrais de noticias online, destaIormaIoipossivelidentiIicarosassuntos mais comentados na rede que esto relacionados anoticias e, at mesmo, apontar quais dessas noticias sepropagamnoTwitterantesmesmoseserempublicadas.OutracontribuiodestetrabalhoIoiaelaboraodeumaanaliseda composio dos tweets sobreos'AssuntosdoMomento atravs da medio de taxas de retweets, menes, URLs eatitudes positivas/negativas das mensagens, discutindoprincipalmente os resultados associados aos assuntos que estoligadosanoticias.At onde de conhecimento dos autores deste artigo, este oprimeiro trabalho investigativo sobre o Twitter que explora emsuaanalise:(i)adiscussodenoticiasnarede;(ii)acategorizaodos assuntos mais comentados incluindo os grassroots; e (iii) amedio de atitudes positivas/negativas nos tweets sobre os'Assuntos do Momento.Estetrabalhopodeseropontodepartidaparapesquisasemoutrasareas.Entenderascaracteristicasdacomposiodos 'Assuntos do MomentonoTwitterimportanteparaacriaodenovas estratgias de marketing e a analise da sua propagao parainvestigaesnaareadecomunicao.Como trabalho Iuturo pretende-se realizar uma investigao maisproIunda,apartirdeumacoletadedadosglobaisnoTwitter,comuma durao de 30 dias e incluindo mais Iontes de centrais denoticias, pois esperado pelosautoresqueonumerode assuntosdiscutidossobrenoticiasaumentenessascondies.6.REFERNCIAS|1|Java,A.,Song,X.,Finin,T.,andTseng,B.2007.Whywetwitter:understandingmicrobloggingusageandcommunities.InProceedingsoIthe9thWebKDDand1stSNA-KDD2007workshoponWebminingandsocialnetworkanalysis(WebKDD/SNA-KDD'07).ACM,NewYork,NY,USA,56-65.|2|Twitter.Disponivelem:http://twitter.com,Acessoem:30deJunhode2011.|3|Huberman,B.,Romero,D.andWu,F.2009.Socialnetworksthatmatter:Twitterunderthemicroscope.FirstMonday,Volume14,Number1-5January,2009.|4|Kwak,H.,Lee,C.,Park,H.andMoon,S.2010.WhatisTwitter,asocialnetworkoranewsmedia?InProceedingsoIthe19thinternationalconIerenceonWorldwideweb(WWW'10).ACM,NewYork,NY,USA,591-600.|5|Wu,S.,HoIman,J.M.,Mason,W.A.andWatts,D.J.2011.Whosayswhattowhomontwitter.InProceedingsoIthe20thinternationalconIerenceonWorldwideweb(WWW'11).ACM,NewYork,NY,USA,705-714.|6|Honeycutt,C.andHerring,S.2009.BeyondMicroblogging:ConversationandCollaborationviaTwitter.HawaiiInternationalConIerenceonSystemSciences,pp.1-10,42ndHawaiiInternationalConIerenceonSystemSciences.|7|Sakaki,T.,Okazaki,M.andMatsuo,Y.2010.EarthquakeshakesTwitterusers:real-timeeventdetectionbysocialsensors.InProceedingsoIthe19thinternationalconIerenceonWorldwideweb(WWW'10).ACM,NewYork,NY,USA,851-860.|8|Bakshy,E.,HoIman,J.M.,Mason,W.A.andWatts.D.J.2011.Everyone'saninIluencer:quantiIyinginIluenceontwitter.InProceeaingsofthefourthACMinternationalconferenceonWebsearchanaaatamining(WSDM'11).ACM,NewYork,NY,USA,65-74.|9|Boyd,D.,Golder,S.,andLotan,G.2010.Tweet,Tweet,Retweet:ConversationalAspectsoIRetweetingonTwitter.InProceegingsoIHICSS`10, 1-10.|10| Cha,M.,Mislove,A.andGummadi,K.P.2009.Ameasurement-drivenanalysisoIinIormationpropagationintheIlickrsocialnetwork.InProceeaingsofthe18thinternationalconferenceonWorlawiaeweb(WWW'09).ACM,NewYork,NY,USA,721-730.|11| Gruhl,D.,Guha,R.,Liben-Nowell,D.andTomkins,A.2004.InIormationdiIIusionthroughblogspace.InProceeaingsofthe13thinternationalconferenceonWorlaWiaeWeb(WWW'04).ACM,NewYork,NY,USA,491-501.|12| TheJavaLanguageSpeciIication.Disponivelem:http://java.sun.com/docs/books/jls/,Acessoem:30deJunhode2011.|13| Twitter4J.Disponivelem:http://twitter4j.org/en/index.html,Acessoem:30deJunhode2011.|14| Rome.Disponivelem:http://rome.dev.java.net/,Acessoem:30deJunhode2011.|15| G1RSS.Disponivelem:http://g1.globo.com/dynamo/rss2.xml,Acessoem:30deJunhode2011.|16| R7RSS.Disponivelem:http://www.r7.com/data/rss/brasil.xml,Acessoem:30deJunhode2011.|17| GoogleNewsBrasilRSS.Disponivelem:http://news.google.com.br/news?pz1&hdlOnly1&cIall&nedpt-BRbr&hlpt-BR&topich&num3&outputrss,Acessoem:30deJunhode2011.|18| Suh,B.,Hong,L.,Pirolli,P.andChi,E.H.2010.WanttobeRetweeted?LargeScaleAnalyticsonFactorsImpactingVIII Simpsio Brasileiro de Sistemas Colaborativos- 14 -RetweetinTwitterNetwork.InProceeaingsofthe2010IEEESeconaInternationalConferenceonSocialComputing(SOCIALCOM'10).IEEEComputerSociety,Washington,DC,USA,177-184.|19| Zarrella,D.2009.ScienceoIRetweets.Disponivelem:http://danzarrella.com/the-science-oI-retweets-report.html,Acessoem:30deJunhode2011 VIII Simpsio Brasileiro de Sistemas Colaborativos- 15 -Social networks and collective intelligence applied topublic transportation systems: A surveyAna Paula ChavesCoordination of TechnologySystems for InternetFederal TechnologicalUniversity of Paran (UTFPR)Campo Mouro - [email protected] SteinmacherCoordination of TechnologySystems for InternetFederal TechnologicalUniversity of Paran (UTFPR)Campo Mouro - [email protected] VieiraDepartment of ComputerScienceFederal University of Bahia(UFBA)Salvador - [email protected] becomingincreasinglychaotic.The use of public transportationis analternative toim-provethisscenario, sinceitdiminishesthenumberof pri-vatevehiclesontheroads. However, toimproveitsqualityisimportanttounderstandtheproblemspeoplearefacingwhen using this kind of transportation. This paper presentsthe results of a survey conducted with public transportationusers which investigates how collaborative systems based onsocialnetworksandcollectiveintelligencecansupportshar-inginformationwiththepassengers. Theresultsshowthatthereisascarcityof waystoobtainreal-timeinformationrelatedtopublictransportationandthattheuseof socialnetworkapplicationsandcollectiveintelligenceisaninter-estingwaytoshareandobtainthiskindofinformation.KeywordsIntelligent Transportation System, collective intelligence, so-cialnetwork1. INTRODUCTIONBigcitiesareincreasinglysueringfromtheproblemofur-ban mobility. Several problems, such as constant trac jam,lackofinvestmentsinroadinfrastructure,andpoorqualityoftheservicesprovidedbypublictransportationmakesthecitizens dailylifestressful andcomplicated. Estimulatingtheuseof publictransportationisessential tosupportur-ban mobility,because it reduces the number of cars on pub-licroads[5]. Besides,sinceBrazilwillbehostingimportantsporteventsinthecomingyears, itisimportanttoinves-tigatehowinformationtechnologycanbeappliedtopublictransportationtobettersupportusersneedsanddecisions.According to [3], the use of information technology for plan-ning, managing, operating and monitoring public transporta-tionhas become afeasible alternative. Intelligent Trans-portationSystems(ITS)aimstoinvestigatehowtoapplywell establishedinformationandcommunicationtechnolo-giestoimprovethequalityof transportationsystems[12].Aclassicationfor ITSsolutions, presentedin[12], con-siderstheareaofAdvancedPublicTransportationSystems(APTS), whichaimstoproposesolutionstosupportinfor-mation provisioning to passengers, such as the current statusandtimetablesof thepublicvehicles, theindicationof theroutelines andthestops attendedbyaline, incidents onpublictransportationwiththeindicationofpossibledelays,andothers. Whennotiedof suchinformation, passengerscan make their decisions easily, planning their route and ac-tivities, which results in less stress and anxiety and more sat-isfactionwiththepublictransportationservices. AccordingtoarecentarticleinWiredmagazine[1],peoplearewillingto leave their cars or motorcycles, if they can get informationinrealtime,aboutthepublictransportation.The popularizationof social media (suchas blogs, socialnetworks and wikis) changed the way people deal with theirdaily problems by increasingly using virtual communities toshareandseekforinformation. Asindicatedin[10], iten-ablescommunitiestosolvemoreproblemsthanitwouldbepossibleindividually. Collectiveintelligenceinvolves com-bining knowledge (which may include behaviors, preferences,ideas,andsoon)providedbyagroupofpeopletoproducenovel informationorinsight[11]. Someapplications[14, 6]that make use of collective intelligence capabilities were pro-posed to collect knowledge based on what is being discussedontheInternet.Inthiscontext, weareinvestigatinghowcollaborativesys-tems, speciallysocial mediaandcollectiveintelligence, canincreasetheawarenessofpublictransportationusersreduc-ingthelackofinformationrelatedtotherouteconditions,the lines availability and the waiting time at bus stops. Thisresearch is part of a project called UbiBus [13] whose objec-tive is to propose, specify and implement technological solu-tionstoeasyusersaccesstopublictransportationinforma-tioninrealtime,basedondynamiccontext-sensitiveinfor-mation,availableonmultipledevices. AmoduleofUbiBus,calledUbiBus-Net, aimstoinvestigateandimplementcol-lectiveintelligencesolutionsandtoolsthatanalyzetextualinformation produced by users on social networks about thepublictransportationconditions,allowingtheaccesstothegeneratedcollectiveknowledge.VIII Simpsio Brasileiro de Sistemas Colaborativos- 16 -TosupporttherequirementselicitationforUbiBus, wede-signed and conducted a survey with transportation users, indierentBraziliancities,throughtheapplicationofaques-tionnaire. This survey aims to identify deciencies and needsrelated to the information provided to public transportationpassengers. Themainadvantageof conductingaeldsur-veyisthatwecanhavetheopinionofwhoactuallyusethepublictransportationandknowtherealservicesconditionsintheircityorregion. Thus, wecandevelopapplicationsclosertousersexpectations.Thispaperpresentstheresultsobtainedinthissurveyandanalyzes the problem of providing information to public trans-portationusers basedoncollective intelligence andsocialnetworks. Toaccomplishit, thepaperisorganizedasfol-lows. Section 2 presents some related work in the area of ITSandCollectiveIntelligence. Section3bringsthemethodol-ogy used to perform the survey. In Section 4, we discuss theresults obtained with the survey, an