Visualização de dados e seu uso no Jornalismo

download Visualização de dados e seu uso no Jornalismo

of 63

Transcript of Visualização de dados e seu uso no Jornalismo

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    1/63

    MATIAS SEBASTIO PERUYERA

    EVERY PICTURE TELLS A STORY: VISUALIZAES DE DADOS E SEU USO

    NO JORNALISMO

    Trabalho de Concluso de Curso apresentado comorequisito parcial para obteno do grau de bacharel

    em Comunicao Social com Habilitao emJornalismo ao Centro Universitrio InternacionalUninter.

    Orientadora: Profa. MSc. Renata Duarte

    CURITIBA

    2012

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    2/63

    AGRADECIMENTOSAos meus colegas do curso de Comunicao da Facinter, pela companhia e apoio

    nesses quatro anos da graduao. Foi muito bom percorrer esse caminho juntos.Aos meus professores, sempre dispostos a tirar dvidas e apontar caminhos.

    Ao Lyn Jannuzzi e demais colegas do departamento de Infografia da Gazeta do

    Povo, pela troca incessante de informao e ideias que representou, sem eu

    perceber, o comeo da minha pesquisa acadmica.

    Ao professor Gustavo Lopes, por ter me ajudado com os artigos que serviram para

    consolidar minha participao no mundo da pesquisa.

    professora Renata Duarte, pelas orientaes que me deixavam com a cabeaborbulhando de ideias e entusiasmo.

    A meus amigos, por compartilharem do meu entusiasmo, mesmo que s vezes no

    entendessem muito bem meus motivos.

    Ao Fernando, que acompanhou meus tropeos desde a primeira faculdade.

    Ao Tercio, pelos eternos planos de conquistar o mundo.

    Ao Basilio, pelo carinho e pela pacincia sem fim.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    3/63

    Now these points of data make a beautiful line

    (Jonathan Coulton, Still Alive)

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    4/63

    RESUMO

    A atual abundncia de informaes numricas das mais variadas origens pode ser

    usada de vrias maneiras pelo jornalismo. O presente Trabalho de Concluso deCurso trata do uso jornalstico de bases de dados de grandes dimenses e como avisualizao pode ser uma maneira adequada para a interpretao desses dados etambm para a divulgao da base de dados como um todo. Em primeiro lugar feita uma anlise do papel das bases de dados e das visualizaes dentro dosdiferentes gneros jornalsticos. analisado o uso histrico e atual das bases dedados, com a finalidade de entender a presena delas nas redaes, alm do uso decomputadores na produo de matrias dentro do conceito de Reportagem Assistidapor Computador (RAC). Essa anlise tambm serve para pensar os diferentesconceitos de base de dados e chegar a um recorte do tipo de base que usada pararealizar visualizaes, alm da possibilidade de uso de visualizaes dentro da RAC

    e do jornalismo de dados. Em seguida, analisado o conceito de visualizao, suautilidade no jornalismo, a relao dela com a infografia jornalstica, e tambm oprocesso pelo qual se obtm uma visualizao e os conhecimentos necessriospara faz-la. Finalmente, so analisados alguns exemplos de visualizaes de meiosvariados: vdeo, estticos, interativos.

    Palavras-chave: visualizao de dados, jornalismo em base de dados, RAC,infografia.

    ABSTRACT

    The current abundance of numerical information from various sources can be usedby journalists in many ways. This Graduation Thesis analyzes the journalistic use oflarge databases and how data visualization can be an appropriate way to understandlarge ammounts of data and to publish them as well. First, we analyzed the role ofdatabases and data visualizations within the different journalistic genres. Then weexamined the historical and current use of databases in order to understand theirpresence in newsrooms, and the use of computers in the production of news within

    the concept of Computer Assisted Reporting (CAR). This analysis also aims to thinkabout the different concepts of database and determine what kind of database shouldbe used to make visualizations, plus the ability to use visualizations in the field ofCAR and data journalism. Then we analyze the concept of visualization, itsusefulness in journalism, its relation to journalistic infographics, and the process andskills necessary to make visualizations. Finally, some examples from diferente media(vdeo, static, interactive) are analyzed.

    Keywords: data visualization, database journalism, CAR, infographics.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    5/63

    SUMRIO

    1 Introduo .......................................................................................................... 10

    1.1 Problema ........................................................................................................ 161.2 Hipteses .............................................................................................. 16

    1.3 Objetivos ............................................................................................... 17

    1.3.1 Objetivo geral .................................................................................. 17

    1.3.2 Objetivos especficos ....................................................................... 17

    1.4 Metodologia ........................................................................................... 17

    2 Bases de dados, visualizaes e gneros jornalsticos ................................ 19

    2.1 No gnero interpretativo ........................................................................ 19

    2.2 No gnero informativo ........................................................................... 21

    2.3 No gnero utilitrio ................................................................................ 21

    2.4 Nos gneros opinativo e diversional ..................................................... 22

    2.5 Visualizaes e gneros jornalsticos.................................................... 22

    3 Bases de dados ................................................................................................. 24

    3.1 Breve histrico e conceitos ................................................................... 24

    3.2 Bases de dados como formato dentro do webjornalismo ...................... 26

    3.3 Bases de dados como produto jornalstico ............................................ 273.4 Dados e ferramentas ao alcance de todos ............................................ 29

    4 Visualizao: da unidade ao conjunto ............................................................. 31

    4.1 Definio ............................................................................................... 31

    4.1.1 Quanto grande ........................................................................... 33

    4.1.2 O que visual ............................................................................... 34

    4.1.3 Quais dados podem ser representados numericamente ................. 35

    4.2 Diferenas entre visualizao e infografia ............................................. 37

    5 Ferramentas e aspectos tcnicos .................................................................... 39

    5.1 Obteno dos dados ............................................................................. 39

    5.1.1 Ferramentas para a manipulao dos dados .................................. 40

    5.2 Apresentao dos dados....................................................................... 41

    5.2.1 Ferramentas para fazer a apresentao dos dados ........................ 42

    5.3 Conseguir qualidade tcnica na reproduo da visualizao................ 43

    5.3.1 Escolha do suporte .......................................................................... 43

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    6/63

    6 Anlise de infogrficos e visualizaes .......................................................... 45

    6.1 How Mariano Rivera Dominates Hitters, the new York Times ............... 45

    6.2 Reading, Writing and Earning Money, Good Magazine ........................ 50

    6.3 Retratos do Paran Gazeta do Povo.................................................. 536.4 Race and Ethnicity: New York Eric Fischer ........................................ 54

    6.5 XKCD Color Survey............................................................................ 56

    7 Concluso .......................................................................................................... 61

    Referncias .............................................................................................................. 64

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    7/63

    10

    1 INTRODUO

    Entre as diferentes linguagens visuais do jornalismo, a que est ganhandomais destaque nos ltimos tempos a visualizao de dados, que uma

    representao visual de um nmero geralmente grande de dados que possam ser

    representados numericamente 1 . Herdeiro da infografia jornalstica, esse formato

    ganhou fora graas a uma combinao de tecnologias: por um lado, as tecnologias

    que geram bases de dados cada vez maiores; por outro, o avano nas ferramentas

    que permitem gerar representaes grficas desses dados. Considerando suas

    caractersticas e os problemas que ela resolve, a visualizao uma ferramenta quepode e deve ganhar espao no jornalismo.

    cada vez mais comum o surgimento de bases de dados de propores

    gigantescas, mas com informaes interessantes do ponto de vista jornalstico. O

    problema que elas trazem para o jornalista que ele dever saber como lidar com

    esse volume de informao tanto para analisar esses dados como para divulg-los.

    Muitas vezes a falta de ferramentas adequadas para a anlise dessas bases deixa o

    jornalista sem poder descobrir informaes latentes e a falta de recursos para exibir

    essas informaes deixa o leitor somente com a informao passada pelo reprter,

    sem acesso totalidade da informao. A visualizao se mostra como uma

    possibilidade de apreender essa informao na totalidade. Como resume Nathan

    Yau:

    Encare. Dados podem ser um tdio se voc no sabe o que estprocurando ou no sabe sequer que h algo a ser procurado. s ummonte de nmeros e palavras que no significam nada alm de seusprprios valores. O melhor de estatsticas e visualizao que eles lhe

    ajudam a procurar alm desses valores. Lembre-se, dados so umarepresentao da vida real. No s um balde de nmeros. H histriasnesse balde. H significado, verdade e beleza. E assim como na vida real,s vezes as histrias so simples e diretas; e outras vezes so complexas eenroladas. Algumas histrias so adequadas a um livro. Outras tm formade novela. com voc, estatstico, programador, designer ou cientista dosdados, decidir como contar a histria. (YAU, 2011) 2

    1 Conceito do autor, detalhado na pgina 31.2Traduo do autor. Texto original: Face it. Data can be boring if you dont know what youre lookingfor or dont know that theres something to look for in the first place. Its just a mix of numbers andwords that mean nothing other than their raw values. The great thing about statistics and visualizationis that they help you look beyond that. Remember, data is a representation of real life. Its not just a

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    8/63

    11

    Segundo Antnio Fidalgo, o jornalismo de dados ter mais importncia na

    produo de notcias relevantes: a minerao de dados uma forma de descobrir

    relaes relevantes entre dados, relaes por vezes completamente inesperadas e,

    por conseguinte, incontestavelmente de valor noticioso (FIDALGO, 2007, p. 166).

    Sendo assim, a incorporao do uso de bases de dados no jornalismo traz ganhos

    que exigem certos conhecimentos para poder aproveit-los.

    A tecnologia mudou as bases de dados tanto no aspecto de cri-las como no

    aspecto de explor-las ou l-las. No primeiro aspecto, surgiram novas formas de

    aliment-las. Bases de dados tradicionais, como as geradas em um censo de

    populao, tm a possibilidade de ficarem mais complexas e inclurem mais dados.

    Novos tipos de bases podem ser criadas com novas tecnologias, como a de PlayerTracking, utilizada pela Fifa na Copa do Mundo de 2010, na qual um sistema gera

    arquivos digitais com as informaes do caminho percorrido pelos jogadores e pela

    bola a partir das imagens captadas por quatro cmeras de vdeo. Outro exemplo a

    enxurrada de informaes sobre gastos de funcionrios pblicos, divulgados por

    ordem das leis de transparncia. A informao enviada internet pelos usurios,

    como os metadados 3 e tags4presentes em fotografias postadas no Flickr, por

    exemplo, tambm podem compor uma base de dados extensa para quem quisercompilar e consolidar os dados. A extrao de dados de sistemas fechados tambm

    pode ser considerada uma possibilidade de origem de dados, mesmo que

    escondidos em sistemas de difcil acesso e precisando de meios automatizados para

    extra-los.

    No aspecto da explorao das bases de dados, a tecnologia facilita tarefas

    que, se feitas mo, levariam muito tempo ou seriam impraticveis. Manualmente,

    possvel pegar um dado aqui ou ali (desde que a base tenha sido planejada para serconsultada, organizada alfabeticamente ou ter uma interface para fazer consultas,

    por exemplo), mas sem a facilidade do computador.

    bucket of numbers. There are stories in that bucket. Theres meaning, truth, and beauty. And jus t likereal life, sometimes the stories are simple and straightforward ; and other times theyre complex and

    roundabout. Some stories belong in a textbook. Others come in novel form. Its up to you, thestatistician, programmer, designer, or data scientist to decide how to tell the story.3 Dados anexos a arquivos digitais, como dados de georreferenciamento inclusos em fotografias.4 Palavras-chave atribudas a arquivos digitais, como postagens em blogs.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    9/63

    12

    Dependendo do tipo de dados de cada base, h vrias maneiras de se

    aproximar a ela, ou de minerar5 os dados. Uma abordagem possvel a matemtica,

    possibilitada principalmente por softwares de planilhas, como o Microsoft Excel, e de

    bancos de dados, como o Microsoft Access. possvel fazer operaes entre os

    nmeros da base, para transformar nmeros absolutos em nmeros relativos,

    possveis de serem comparados entre si; classificar elementos por rank; contar

    quantos elementos cumprem ou no uma determinada condio; realizar buscas por

    padres especficos, como o nmero de um documento; resumir os dados utilizando

    mdias e medianas; e um longo etctera.

    Esse mtodo gera pistas para a obteno de novas informaes, que podem

    ser transmitidas ao pblico ou podem ser usadas pelo jornalista para gui-lo noprocesso de produo de uma matria. Esse uso do computador por parte de

    jornalistas tem um marco na criao do conceito de Reportagem Assistida por

    Computador (GARRISON apud BARBOSA, 2007, p. 109). De qualquer maneira, as

    informaes provenientes desses mtodos podem at resumir os dados presentes

    na base, mas em um processo de edio tradicional, no qual h perda de dados. O

    clculo de uma mdia no representa cada um dos valores. A escolha de quais

    valores de uma srie sero mostrados tem um certo grau de arbitrariedade, e essaescolha pode ser til para o propsito de uma investigao jornalstica especfica,

    mas intil para outra. Em alguns casos, pode ser interessante que a populao em

    geral tambm tenha acesso aos dados, mas algumas bases podem ser complexas

    demais para serem compreendidas. A visualizao se apresenta como uma

    alternativa plausvel para melhorar o acesso a esses grandes volumes de dados,

    tanto para uso do jornalista como para a divulgao de informaes.

    Em uma visualizao se determina um cdigo visual, com maior ou menorcarga semntica, cujas variveis grficas (BERTIN, 1986, p. 186) representam

    aspectos numricos ou que tenham sido transpostos para uma linguagem

    numrica. Uma das premissas de uma visualizao, segundo Lev Manovich (2011, p.

    157), que ela contenha e represente graficamente a totalidade da informao

    disponvel. A visualizao manteria, portanto, a mesma caracterstica da base de

    dados nela representada de no ter um direcionamento da informao.

    5 Termo que tem sido usado para se referir ao ato de extrair nmeros e dados de sites ou similares,atravs de programas de computador.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    10/63

    13

    As tecnologias informticas, alm de facilitar a produo de visualizaes,

    permitem tambm que sejam exibidas de forma adequada. Dispositivos de altssima

    resoluo permitem a exibio dos mais pequenos detalhes, sem perdas de

    informao visual (MANOVICH, 2011, p. 165). Refinamentos no processo de

    impresso (TUFTE, 1990, p. 8195) tambm atingem o mesmo objetivo. Seja em

    monitores ou meios impressos, visualizaes de dados de alta densidade permitem

    que os leitores naveguem pelos dados e escolham os que lhes interessam,

    construindo suas prprias narrativas (TUFTE, 1990, p. 50). Essa navegao

    auxiliada pelo fato de as visualizaes serem geralmente derivadas dos j

    estabelecidos grficos estatsticos presentes na infografia jornalstica como

    grficos de pizza, grficos de barras ou mapas o que garante a usabilidade6 davisualizao.

    Apesar da popularizao das tcnicas de produo, com o surgimento de

    sites nos quais possvel produzir visualizaes com facilidade7, o uso por parte do

    jornalismo continua limitado. Prova disso que a quantidade de visualizaes

    produzidas por profissionais que renem o tino de encontrar informaes em bases

    de dados e tm as habilidades de programao e design para chegar a um resultado

    desejado. De certa maneira, so eles quem deram um pontap inicial para que ojornalismo considerasse o uso de visualizaes complexas que vo alm dos j

    tradicionais infogrficos. Exemplo desse tipo de trabalho a visualizao See

    Something or Say Something (Fig. 1), de Eric Fischer (FISCHER, 2011), que

    mapeou a localizao de fotos publicadas no Flickr8 e de tweets9 no mundo e em

    vrias cidades.

    A base de dados da qual Fischer partiu saiu dos prprios sites, que

    armazenam dados de geolocalizao (latitude e longitude) das fotos e dos tweets.Fischer criou um programa que localizou os pontos e lhes atribuiu a cor azul ou

    vermelha se fossem tweets ou fotos, respectivamente. O resultado um mapa que

    delineia as cidades representadas somente com estas informaes, e torna visveis

    padres de uso da internet em cada cidade. O exemplo a visualizao da cidade

    6 Termo que se refere a quanto um objeto fcil de usar. usado aqui de maneira mais ampla, no

    sentido de quo fcil de ler um grfico ou visualizao.7 Exemplos so o site Many Eyes e Wordle, citados na pgina 43.8 Site para publicao e compartilhamento de fotografias (www.flickr.com)9 Cada uma das mensagens publicadas por usurios do Twitter (www.twitter.com)

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    11/63

    14

    do Rio de Janeiro (Fig. 1), onde possvel ver aglomeraes de fotos em pontos

    tursticos como o Cristo Redentor e o bairro da Urca, e aglomeraes de tweets em

    pontos de trnsito como a ponte RioNiteri e o aeroporto do Galeo. A quantidade

    de informao mostrada nessa visualizao enorme, e seria intil se exibida de

    outra maneira. a nica maneira de descobrir certos padres. Porm, certas

    condies so necessrias para que um material dessas caractersticas tenha valor

    jornalstico.

    Fig. 1 Visualizao da srie "See Something or Say Something", de Eric Fischer, mostrando a cidadedo Rio de Janeiro. Fonte: FISCHER, 2011.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    12/63

    15

    Alguns jornais, como o The New York Times e o The Guardian, utilizaram

    esse recurso para contar histrias e agora produzem visualizaes com frequncia,

    como uma linguagem estabelecida, mas com cuidados textuais e imagticos para

    garantir que sejam comprendidos pela maior parte da audincia. essa transio

    dos artistas-programadores para o jornalismo que definir as possibilidades da

    visualizao como uma linguagem jornalstica, ou at como um gnero.

    O jornalismo tem se aproveitado cada vez mais de linguagens visuais, como

    a infografia, atravs da qual a visualizao comeou a entrar nos meios massivos.

    Porm, a visualizao tem caractersticas de linguagem que necessrio

    compreender melhor. Sua no linearidade faz com que o processo de edio no

    tenha paralelos. Em outras linguagens jornalsticas, como a reportagem, o vdeo, afotografia ou at os infogrficos jornalsticos, h decises de corte, de deixar

    material de fora, mas no dentro da ao de um gatekeeper10, e sim por mera

    limitao fsica do tamanho disponvel para um texto ou o tempo disponvel para

    uma matria. Isso diferente nas visualizaes: uma caracterstica delas que no

    haja cortes nos dados; absolutamente toda a informao disponvel usada na

    confeco da imagem final.

    Marshall McLuhan (1969, p. 72) afirma que o surgimento de um novo meiode comunicao altera os meios j existentes. Assim como o rdio foi modificado

    pelo surgimento da televiso, a visualizao est modificando a infografia jornalstica

    tradicional, fornecendo-lhe novas possibilidades; e tambm o jornalismo em si,

    oferecendo a possibilidade de apresentar ao leitor uma base de dados de maneira

    integral, o que no era possvel at ento.

    De modo geral, o jornalismo ainda no absorveu essa influncia e no

    definiu o papel de uma linguagem com essas caractersticas. Alguns experimentos,geralmente realizados por pessoas que combinavam habilidades em design e

    programao com curiosidade de construir e explorar bases de dados, encorajaram

    que alguns meios experimentassem usar visualizaes como recurso jornalstico.

    Neste momento, em que o jornalismo est usando cada vez mais esse recurso,

    necessrio pensar em melhorar as possibilidades e capacitar o jornalismo e os

    jornalistas para identificar situaes em que visualizaes possam ser teis e o

    10 Termo que se refere a quem decide quais notcias sero divulgadas (BAHIA, 1990).

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    13/63

    16

    que necessrio para faz-las. Tambm necessrio pensar nas necessidades do

    leitor quanto a repertrio e capacidade de extrair informao das visualizaes

    fornecidas.

    As caractersticas e possibilidades da visualizao no tm paralelo nem

    precedente. A compreenso delas fundamental para identificar oportunidades de

    us-la e, quando isso acontecer, ter um mnimo de recursos para realiz-la.

    1.1 PROBLEMA

    Quais as condies necessrias para que a visualizao de dados se afirme

    como um formato jornalstico adequado para meios massivos?

    1.2 HIPTESES

    Para que a visualizao de dados se afirme como linguagem jornalstica,

    principalmente quando for a nica forma de comunicar grandes volumes de dados,

    necessrio uma ateno especial ao espectro de leitores no que se refere a facilitar

    a sua compreenso. Esse apoio ao leitor pode se dar, por exemplo, atravs de

    legendas e explicaes sobre como fazer a leitura. Dentro dessa compreenso,

    tambm necessrio considerar que as visualizaes sejam adequadas ao suporte

    final, seja impresso, web, vdeo ou outro.

    H vrios recursos de software que permitem que qualquer pessoa faa

    visualizaes com facilidade. Porm, ainda necessrio conhecimento prvio do

    assunto que se quer abordar, para escolher qual dos modelos pr-existentes o

    mais adequado. E conhecimentos de programao do a liberdade de no ter que

    se adaptar aos formatos predeterminados dos softwares j existentes.

    necessrio um conhecimento multidisciplinar para a realizao de

    visualizaes dentro do jornalismo, independente da ferramenta escolhida.

    necessrio conhecimento jornalstico para ver o que interessante; conhecimento

    de estatstica para escolher os dados corretos e fazer operaes entre eles a fim de

    gerar nmeros mais teis; conhecimentos de design para produzir uma visualizao

    que seja possvel de ser reproduzida no suporte escolhido; e os conhecimentos da

    prpria ferramenta que vai gerar a visualizao, seja uma ferramenta especfica ouuma linguagem de programao. O realizador da visualizao pode prescindir de

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    14/63

    17

    alguns desses conhecimentos, mas, mais cedo ou mais tarde, precisar de ajuda

    para suprir o que falta.

    1.3 OBJETIVOS

    1.3.1 Objetivo geral

    Analisar, do ponto de vista comunicacional, as condies necessrias tanto

    para a realizao de visualizaes de dados como para que ela se torne mais uma

    linguagem possvel dentro do jornalismo.

    1.3.2 Objetivos especficos

    Analisar a relao das bases de dados e das visualizaes com os

    diferentes gneros jornalsticos, para entender as possibilidades que elas tm como

    formato jornalstico.

    Comparar as diferentes abordagens de bases de dados dentro dos j

    usados por diferentes autores.

    Analisar quais as ferramentas e mtodos disponveis para a realizao de

    visualizaes de acordo com as possibilidades e estruturas de cada meio de

    comunicao.

    Analisar as possibilidades e limitaes das visualizaes de diferentes tipos

    de dados nos meios de massa e em diferentes suportes, como web, impresso e

    vdeo.

    Propr diferentes nveis de conhecimento (multidisciplinar) que os jornalistas

    devem ter para realiz-la.

    1.4 METODOLOGIA

    Para conceitualizar os elementos pesquisados, foi feita pesquisa

    bibliogrfica, fazendo conexes entre autores das reas do design da informao e

    da comunicao. Essa pesquisa tambm aportou base terica para uma posterior

    pesquisa descritiva, na qual foram analisados alguns exemplos de visualizaes de

    dados, tanto publicados em meios jornalsticos como em outros contextos. Essa

    diferenciao foi feita para buscar elementos que os veculos jornalsticos teriam

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    15/63

    18

    usado para garantir a leitura e entendimento das visualizaes, em contrapartida a

    um possvel maior descompromisso de visualizaes que no foram publicadas em

    meios jornalsticos. Foram escolhidos seis exemplos de visualizaes de dados,

    sendo trs dentro de um contexto de mdia de massa e trs que no

    necessariamente tm objetivos jornalsticos, mas tm um carter exploratrio.

    Dentro da mdia de massa, o principal objeto de pesquisa ser o infogrfico

    em vdeo How Mariano Rivera Dominates Hitters, publicado pelo New York Times,

    que inclui dois usos de visualizao, para explorao dos dados pelos jornalistas e

    para a visualizao do pblico (CARTER; GRAHAM; WARD, 2010). Tambm sero

    analisados os infogrficos Reading, Writing and Earning Money, da revista Good

    (HUBACEK, 2011) e Os nmeros do estado, base de dados presente na srie dereportagens Retratos do Paran, do jornal curitibano Gazeta do Povo (GAZETA,

    2011).

    No que se refere a visualizaes no-jornalsticas, sero analisadas a srie

    Race and Ethnicity, de Eric Fischer (FISCHER, 2010) e duas visualizaes da

    mesma base de dados (LUMINOSO, 2012 e VON WORLEY, 2012), resultado da

    pesquisa Color Survey, feita pelo quadrinhista Randall Munroe (MUNROE, 2010).

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    16/63

    19

    2 BASES DE DADOS, VISUALIZAES E GNEROS JORNALSTICOS

    Dentro das redaes, os gneros jornalsticos exercem um papel

    semelhante ao de um cardpio. O reprter sabe se um assunto vai render uma nota,

    uma notcia, ou uma reportagem; um editor solicita uma matria de anlise ou uma

    matria de servio; opinies so expressadas atravs de editoriais e de charges; um

    programa de televiso pode ser uma entrevista ou um documentrio. A taxonomia

    do jornalismo serve para delinear o produto final como um conjunto onde

    predominaro produtos de um ou outro tipo, como o jornalismo literrio na revista

    Piau11, ou matrias de anlise em um jornal econmico.

    Encaixar as bases de dados e as visualizaes em algum ou alguns gneros inclu-las nesse cardpio, para que os jornalistas considerem a

    possibilidade de us-las. Discutir os gneros tambm serve para decidir qual a

    funo de uma visualizao: ela pode ter o valor de uma reportagem, ou prestar um

    servio, por exemplo. O ponto de partida para a anlise ser a taxonomia definida

    por Jos Marques de Melo: informativo, opinativo, interpretativo, diversional e

    utilitrio (COSTA, 2010, p. 43). Uma primeira leitura encaixaria as base de dados e

    as visualizaes no jornalismo interpretativo. Porm, no se deve descartar umapossvel apropriao do formato pelos outros gneros jornalsticos.

    2.1 NO GNERO INTERPRETATIVO

    consenso entre vrios autores o pioneirismo de Alberto Dines ao fundar o

    Departamento de Pesquisa e Documentao do Jornal do Brasil(COSTA; LUCHT,

    2010, p. 109). Esse fato, que ocorreu em meados dos anos 60, considerado um

    marco do jornalismo interpretativo no Brasil. Tambm pode ser considerado um

    marco do jornalismo em base de dados (BARBOSA, 2007, p. 104), pelo pioneirismo

    em facilitar informaes aos jornalistas, o que j cria uma relao entre o jornalismo

    interpretativo e o jornalismo em base de dados.

    Mrio Erbolato cita que o jornalismo interpretativo tambm conhecido

    como jornalismo em profundidade, jornalismo explicativo ou jornalismo motivacional

    (ERBOLATO apud COSTA; LUCHT, 2010, p. 109). Segundo Paulo Roberto Leandro

    11 Revista brasileira que se caracteriza por reportagens longas, no estilo do jornalismo literrio.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    17/63

    20

    e Cremilda Medina, realmente o esforo de determinar o sentido de um fato,

    atravs da rede de foras que atuam nele no a atitude de valorao desse fato ou

    de seu sentido, como se faz em jornalismo opinativo (LEANDRO; MEDINA apud

    COSTA; LUCHT, 2010, p. 110). Cabe destacar que Leandro e Medina no

    consideravam o jornalismo interpretativo como um gnero separado. Ainda segundo

    eles, no jornalismo interpretativo,

    as linhas de tempo e espao se enriquecem: enquanto a notcia registra oaqui, o j, o acontecer, a reportagem interpretativa determina um sentidodesse aqui num crculo mais amplo, reconstitui o j no antes e no depois,deixa os limites do acontecer para um estar acontecendo atemporal oumenos presente. Atravs da complementao de fatos que situem ouinterpretem o fato nuclear, atravs da pesquisa histrica de antecedentes,

    ou atravs da busca do humano permanente no acontecimento imediato, agrande reportagem interpretao do fato jornalstico (ibidem, p. 111).

    Costa e Lucht tambm citam Luiz Beltro, que fala na interpretao como o

    ato de submeter os dados recolhidos no universo das ocorrncias atuais e idias

    atuantes a uma seleo crtica, a fim de proporcionar ao pblico os que so

    realmente significativos (BELTRO apud COSTA; LUCHT, 2010, p. 112). Na

    anlise de Costa e Lucht dos textos de Beltro, encontra-se que ele pondera sobre

    quem deve fazer a interpretao, se o jornalista ou o pblico. No primeiro caso, h apossibilidade de o produto jornalstico ter carter opinativo disfarado de

    interpretao, o que leva Beltro a definir jornalismo interpretativo como um

    jornalismo que oferece todos os elementos da realidade, a fim de que a massa, ela

    prpria, a interprete (ibidem, p. 113). O resultado seria a informao em toda a sua

    integridade, captada, analisada e selecionada pelo jornalista, ao qual no cabe o

    diagnstico (idem).

    Apesar que a variedade de conceitos e ideias parece confirmar que o

    jornalismo interpretativo uma categoria carente de configurao estrutural

    (MARQUES DE MELO apud COSTA; LUCHT, 2010, p. 113), encontram-se

    afinidades entre os ideais do jornalismo interpretativo e as visualizaes, a comear

    pelo uso de bases de dados, mesmo que no como formato e sim como apoio ao

    jornalista. A ausncia de opinio citada por Beltro e por Leandro e Medina tambm

    afim imparcialidade das visualizaes. Leandro e Medina citam o

    aprofundamento da informao como inerente ao jornalismo interpretativo; a ideia

    das bases de dados e visualizaes de disponibilizar a totalidade de uma informao

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    18/63

    21

    uma maneira de aprofundar o conhecimento, e tambm condizente com a ideia

    de Beltro de oferecer ao leitor todos os elementos da realidade.

    2.2 NO GNERO INFORMATIVO

    Segundo Nilson Lage, o jornalismo informativo se apoia no trip

    imparcialidade, veracidade e objetividade (LAGE apud COSTA, 2010 p. 48). Sobre a

    objetividade, destaca-se com a definio citada por Costa e por Michael Kunczik: [a

    objetividade] o grau de identidade entre o fato e a sua descrio mediante a

    informao (KOSCHWITZ apud KUNCZIK, 2002, p. 223). Para Marques de Melo, o

    jornalismo informativo a combinao da articulao entre os acontecimentos reaise sua expresso (MARQUES DE MELO apud COSTA, 2010, p. 50).

    Nas bases de dados, essa articulao reduzida ou inexistente, e portanto

    (quase) no h risco de falta de objetividade. Nas visualizaes, essa articulao se

    d no pela escolha de quais dados sero exibidos, e sim pela escolha de como

    fazer para que os dados sejam exibidos em sua totalidade. A expresso dos

    acontecimentos reais se d atravs da transformao deles em nmeros e a

    transformao desses nmeros em smbolos, como ser visto adiante.

    Todavia, h possibilidades de perda de objetividade na construo de bases

    de dados e de visualizaes. Se nas reportagens e matrias escritas o que faz com

    que a objetividade varie so escolhas de sintaxe, de lxico e de temtica (COSTA,

    2010, p. 48), nas visualizaes e bases de dados essa variao pode acontecer por

    uma escolha errada dos dados ou de sua fonte, ou por escolher um tipo de grfico

    que privilegie certo aspecto dos dados e no outro.

    2.3 NO GNERO UTILITRIO

    Se concebidas para que o leitor tenha acesso informao que precisa, as

    bases de dados e as visualizaes podem ser uma forma de jornalismo de servio,

    mas isso depende da natureza dos dados disponibilizados. Uma base de dados com

    o dinheiro gasto pelos deputados tende funo informativa; j um mapa que

    mostra quais os cinemas da cidade se aproxima do servio, j que serve para saber

    qual cinema fica mais perto da casa do leitor. Porm, os dados no perdem o carterinformativo: esse mapa dos cinemas pode servir tambm, por exemplo, para tirar

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    19/63

    22

    concluses sobre qual regio da cidade registra maior concentrao de cinemas, e

    essas concluses podem servir para realizar uma anlise sobre os fatores scio-

    econmicos prprios dessas regies.

    2.4 NOS GNEROS OPINATIVO E DIVERSIONAL

    Dentro de um material de natureza opinativa ou diversional, os dados devem

    manter sua integridade, e a base ou visualizao em si mantm a natureza

    informativa. A linguagem dos dados comunica uma preciso que no deve ser usada

    para transmitir dados errneos ou subjetivos. Apesar de uma visualizao poder ser

    usada para expressar valores gerados a partir de subjetividades, a linguagem dogrfico nos remete a uma preciso. Um grfico no pode ser subjetivo: em todo caso,

    ele mede, objetivamente, subjetividades. Por mais que ele apoie um material

    opinativo, as bases de dados (ou as visualizaes) devem mantm a essncia

    informativa, e nem a opinio do autor nem a subjetividade dele devem permear os

    dados.

    2.5 VISUALIZAES E GNEROS JORNALSTICOS

    Alm da tentativa de encaixar as visualizaes e bases de dados em

    gneros, interessante pensar em como elas se encaixam na classificao de

    Marques de Melo do jornalismo informativo: nota, notcia, reportagem e entrevista

    (MARQUES DE MELO apud COSTA, 2010, p. 55). Desconsiderando esta ltima,

    passamos sequncia nota-notcia-reportagem. A nota uma coisa curta, que pode

    se transformar em uma notcia. Ambas se caracterizam pela imediatez da

    informao em oposio ao aprofundamento tpico da reportagem, que o relato

    ampliado de um acontecimento que j repercutiu no organismo social e produziu

    alteraes que j so percebidas pela instituio jornalstica ( ibidem, p. 53). Pela

    natureza de fazer um levantamento e edio de uma base de dados, possvel

    considerar que a maioria das bases de dados (e visualizaes) se encaixariam na

    categoria reportagem. Mesmo em casos que a visualizao seja minscula e

    subordinada a uma notcia, a ideia de aprofundamento e pesquisa se mantm. Por

    exemplo, uma notcia sobre a alta do dlar pode ser acompanhada por umavisualizao mostrando os valores anteriores, o que implica, em uma escala

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    20/63

    23

    reduzida, uma pesquisa e um aprofundamento da informao, tambm

    emparentados com o jornalismo interpretativo.

    Por serem gneros que so definidos principalmente pela forma, uma

    tarefa complicada encaixar as bases de dados e as visualizaes em algum dos

    gneros jornalsticos j existentes. Elas tm afinidade tanto com o gnero

    interpretativo como com o informativo, alm de poderem ser usadas em contextos

    opinativos ou at diversionais. Na maioria dos casos podem ter o peso de uma

    reportagem, estar mais prximo da objetividade desejada pelo gnero informativo e

    proporcionar a profundidade necessria ao gnero interpretativo.

    Mais do que tentar encaix-las em alguma dessas categorias, o jornalista

    deve saber dessas caractersticas das bases de dados e das visualizaes parasaber quando e como us-las, assim como sabe quando um artigo opinativo

    adequado a alguma cobertura jornalstica. Com isso, as bases de dados e as

    visualizaes podem e devem fazer parte do cardpio de um veculo

    jornalstico.

    Esse delineamento de qualidades das bases de dados e das visualizaes

    tambm deve ser considerado no momento de no us-las. necessrio pensar se

    disponibilizar uma base de dados realmente til para o leitor, ou se o uso de umavisualizao em um contexto de opinio no vai contradizer o articulista, por

    exemplo. Assim como com todos os outros formatos jornalsticos existentes,

    necessrio escolher e editar corretamente.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    21/63

    24

    3 BASES DE DADOS

    I read the news today oh, boy

    Four thousand holes in Blackburn, LancashireAnd though the holes were rather smallThey had to count them all

    Now they know how many holes it takes to fill the Albert Hall(The Beatles, A Day in the Life)

    O uso das bases de dados por parte do jornalismo est em um processo de

    mudana, ficando mais comum dentro da redao e mais visvel fora dela. Elas

    ganharam cada vez mais espao nas redaes, primeiro como apoio para aapurao e depois como um lugar para procurar informaes que possam apoiar ou

    inspirar reportagens. Nessa transio, as bases de dados esto se afirmando como

    um novo formato. Por exemplo, impossvel citar, em uma reportagem, a taxa de

    analfabetismo de todos os municpios brasileiros; mas possvel fornecer ao leitor

    uma ferramenta na qual ele possa consultar a taxa do seu municpio.

    Essas possibilidades implicam na edio e tratamento das informaes,

    alm da criao de uma interface para que o usurio possa navegar e fazer

    consultas. Porm, poucos dados podem ser consultados de cada vez. A outra

    abordagem possvel, que permite a apreenso de todos os dados simultaneamente,

    a visualizao. Os dados so a origem de uma visualizao e a principal razo de

    produzi-las. E o recurso de poder visualizar os dados deveria estar sempre presente

    em redaes onde sejam usadas informaes desse tipo.

    3.1 BREVE HISTRICO E CONCEITOS

    Em primeiro lugar, necessrio pensar nas diferentes definies de base de

    dados. Comearemos por um conceito oriundo da cincia da computao, citado por

    Manovich:

    Nas cincias da computao, a base de dados definida como umacoleo de dados estruturada. Os dados armazenados em uma base dedados esto organizados para permitir sua rpida busca e recuperaousando um computador e, portanto, a base tudo exceto uma simplescoleo de itens. Diferentes tipos de bases de dados hierrquicas, de rede,relacionais e orientadas ao objeto usam diferentes modelos para organizaros dados. [] Eles aparecem como colees de itens nos quais o usurio

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    22/63

    25

    pode fazer vrias operaes: ver, navegar, buscar. (MANOVICH, 2001, p.194).12

    O conceito citado por Manovich amplo o bastante para incluir os bancos de

    dados usados nos primrdios da informatizao das redaes, entre meados dos

    anos 60 e comeo dos 70. Nessa poca, a funo dos bancos de dados era servir

    de apoio redao, em uma espcie de biblioteca digital com enciclopdias,

    resumos de artigos, fontes para ajudar na produo de matrias (BARBOSA, 2007,

    p. 104).

    Esse comeo levou ao surgimento da RAC Reportagem Assistida por

    Computador, que a ideia de usar computadores para obter informao para as

    notcias (GARRISON apud BARBOSA, 2007, p. 109). A RAC passou por mutaesem meados dos anos 90, com a popularizao da Internet, e continuar mutando,

    medida que novas ferramentas sejam criadas.

    Alm da maneira de produzir reportagens, o uso de computadores e a

    popularizao da web tambm influenciou na maneira de transmit-las. Isso pode ser

    visto comparando as trs geraes de webjornalismo (MIELNICZUK, 2003, p. 29): a

    primeira, que a transposio do formato do jornal impresso para a internet; a

    segunda, quando comearam a ser usados alguns recursos interativos e a terceira,onde os recursos prprios da internet comeam a ser usados de maneira mais

    natural e valorizando a interao com o leitor.

    no webjornalismo de terceira gerao que comea a se pensar na base de

    dados menos como um depsito das informaes de um site de notcias (MACHADO,

    2007, p. 117) e mais como um elemento independente, com carter jornalstico e

    uma edio especfica. Em qualquer uma dessas abordagens, a base de dados

    indispensvel para a existncia do webjornalismo.Pensando na funo das bases de dados como repositrio de informaes

    de um site, temos que so necessrias para possibilitar o envio e exibio de textos,

    fotos e vdeos, entre outros, que componham uma notcia. Essa ideia coerente

    com o conceito de Manovich, de que sero elas quem estruturo os novos objetos

    12 Traduo do autor. Texto original: In computer science database is defined as a structuredcollection of data. The data stored in a database is organized for fast search and retrieval by a

    computer and therefore it is anything but a simple collection of items. Different types of databases hierarchical, network, relational and object-oriented use different models to organize data. [] Theyappear as a collections of items on which the user can perform various operations: view, navigate,search.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    23/63

    26

    miditicos: todos os objetos da nova mdia, sejam eles criados desde o incio em

    computadores ou convertidos a partir de fontes analgicas, so compostas de

    cdigo digital; eles so representaes numricas. (MANOVICH, 2011, p. 49).13

    importante destacar que uma base de dados, tanto nos conceitos citados

    como no recorte para esta pesquisa, no necessariamente composta por nmeros;

    possvel trabalhar com todo tipo de informaes e, inclusive, todo tipo de mdias,

    como ser visto nos exemplos apresentados no decorrer do trabalho.

    Na funo das bases de dados como elemento jornalstico, temos que so

    fundamentais para associar informaes, como outras notcias, atravs de

    elementos hipertextuais, alm de cumprir o papel de um arquivo cada vez mais

    dinmico e fcil de acessar, ou at, segundo Machado, como um espao para acomposio de narrativas multimdia (MACHADO, 2007, p. 111).

    Nesses dois casos, possvel pensar no meio por onde se tem acesso a

    essa base de dados (geralmente um site de notcias, mas tambm agregadores,

    leitores de RSS, ou at SMS) como uma interface entre a base de dados e o leitor.

    possvel aplicar a seguinte ideia de Manovich:

    Alguns objetos de mdia seguem explicitamente a lgica das bases de

    dados em sua estrutura enquanto outras no; mas por debaixo da superfciepraticamente todos so bases de dados. Geralmente, a criao de umtrabalho de novas mdias pode ser entendida como a construo de umainterface para uma base de dados. (MANOVICH, 2001, p. 200)14

    Tanto na funo de motor como na funo jornalstica, as bases de dados

    so, na maioria dos casos, um elemento invisvel ao leitor. Porm, elas esto ficando

    cada vez mais em evidncia como objeto de mdia, ou, para este trabalho, como

    formato jornalstico.

    3.2 BASES DE DADOS COMO FORMATO DENTRO DO WEBJORNALISMO

    Mielniczuk (2003, p. 39) define seis caractersticas do webjornalismo:

    interatividade, personalizao, hipertextualidade, multimidialidade ou convergncia,

    13Traduo do autor. Texto original: All new media objects, whether they are created from scratch oncomputers or converted from analog media sources, are composed of digital code; they are numerical

    representations.14 Traduo do autor. Texto original: "Some media objects explicitly follow database logic in theirstructure while others do not; but behind the surface practically all of them are databases. In general,creating a work in new media can be understood as the construction of an interface to a database."

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    24/63

    27

    memria e instaneidade ou atualizao contnua. Essas caractersticas se

    encontram presentes tambm quando deixamos de pensar nas bases de dados

    como um motor de um site de notcias e comeamos a pens-las como produto

    jornalstico: graas interao conseguimos informaes personalizadas, o

    hipertexto faz parte dessa interao, e os dados so preservados e atualizados

    constantemente. No que se refere multimidialidade, podemos considerar que as

    bases de dados se juntam s fotografias e vdeos como mais um elemento.

    Fidalgo (2007, p. 109), alm de reafirmar a validade do formato jornalstico,

    considera a base de dados como um conjunto que pode chegar ao infinito. Segundo

    ele, as bases de dados podem ser acrescidas de cada vez mais dados,

    considerando os novos campos como vrtices, arestas e planos de um poliedro quevai se aproximando da forma de uma esfera, metfora da totalidade absoluta dos

    dados, o que estaria alinhado com a relao de completude apontada por Groth

    como fundamental para o jornalismo (GROTH apud FIDALGO, 2007, p. 108). Apesar

    que Fidalgo se refere totalidade de informaes de um site de notcias, podemos

    aplicar esse pensamento s bases de dados editadas. Por exemplo, uma base com

    informaes de alguns municpios do Paran pode se expandir at ter informaes

    de todos os municpios, e talvez de todos os municpios do Brasil, em sintonia comos conceitos de completude e atualizao contnua.

    3.3 BASES DE DADOS COMO PRODUTO JORNALSTICO

    McLuhan (1969, p. 38) citava a baixa resoluo como uma caracterstica da

    televiso. Os espectadores tm que preencher a imagem, imaginar o que est fora

    dela, pensar nos detalhes menores que as ento grandes linhas que formavam a

    imagem no conseguiam mostrar, e, poca, tambm imaginar as cores. Essa

    limitao tcnica do suporte anloga que acontece com outros suportes e,

    consequentemente, com os produtos jornalsticos veiculados atravs deles.

    Textos tm um tamanho limitado pelos projetos grficos e editoriais de

    jornais e sites, alm das limitaes das mdias, como a limitao de espao fsico em

    pginas de mdias impressas e de cansao ao ler em telas que emitem luz. O corte

    de informaes em fotografias se d j na instncia do clique, onde a deciso varia

    entre o excesso de informao de uma grandeangular e a menor deformao de

    uma teleobjetiva. Ajustes de exposio, contraste e saturao das cores tambm

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    25/63

    28

    implicam na escolha de informao que vai ficar de fora, e por ltimo, o espao

    destinado a elas em uma publicao, impressa ou online, determina que tantos

    detalhes sero visveis. Infogrficos jornalsticos permitem a convivncia de

    informaes em vrias linguagens, mas sofrem as mesmas limitaes das diferentes

    linguagens que eles combinam. Essas possibilidades e limitaes exigem processos

    de edio especficos, nos quais alm da atividade do gatekeepertemos as edies

    que so necessrias por limitaes tcnicas dos meios, como a falta de espao15.

    Pensar a base de dados dentro dos diferentes gneros jornalsticos pode

    ajudar a analis-la como linguagem. Como o termo base de dados diz respeito

    forma que a informao tem, o gnero e/ou a funo pode ser definido a partir da

    deciso do jornalista do que necessrio mostrar, como ser mostrado, e comosera lida, usada ou visualizada pelo leitor.

    Como a premissa das bases de dados apresentar ao leitor a totalidade da

    informao, Fidalgo aponta o problema de como conjugar a conciso que uma

    notcia deve ter com a complexidade inerente alta densidade de dados,

    principalmente no que se refere sua compreenso: A alta resoluo semntica

    no deve descambar num complexo sistema informativo de difcil apreenso

    (FIDALGO, 2007, p. 106). Como soluo, Fidalgo prope uma navegao facilitadapelas diferentes camadas semnticas, que podemos associar com a ideia de

    layeringde Tufte (1990, p. 53) que veremos mais adiante.

    Para este trabalho, consideraremos a base de dados como um conjunto

    de dados que foram selecionados e editados para um determinado propsito

    (grifo meu), como explor-los para conseguir uma visualizao ou divulg-los ao

    pblico mediante uma interface. Essa edio se d no na quantidade dos dados,

    mas sim nas suas qualidades, como veremos adiante. Note-se que essas bases dedados no necessariamente estaro online, mesmo que os dados tenham sido

    obtidos dessa maneira.

    15 Tambm possvel fazer esta edio levando em considerao o interesse do leitor como parte deum pblico alvo, mas isso no ser levado em considerao neste trabalho.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    26/63

    29

    3.4 DADOS E FERRAMENTAS AO ALCANCE DE TODOS

    Estamos passando por um momento no qual se debate se h abundncia ou

    excesso de dados. Mesmo assim, houve uma melhora no acesso informao e a

    recursos informticos, como descrito por Dominique Wolton:

    Tambm para o acesso s bases de dados que o progresso real. Acessar,escolher, circular por si mesmo e fazer a sua prpria informao permitemno somente ganhar tempo, mas tambm acessar reservas deconhecimento totalmente imprevisveis. (WOLTON, 2007, p. 87).

    Esse progresso nos dados e nas ferramentas para analis-los se reflete no

    uso desses recursos por parte do jornalismo. A ideia de fazer a sua prpria

    informao, presente j no surgimento da RAC, reforada pelos recursos

    disponveis para jornalistas, para o pblico em geral, e pelos recursos

    disponibilizados pelo jornalismo para o pblico em geral. Essa proposta est

    alinhada com a filosofia do Open Data16 e a da transparncia poltica, no qual se

    defende que a populao em geral tenha acesso aos dados de gastos dos rgos e

    funcionrios pblicos.

    O jornalismo sempre teve a funo de ser intermedirio entre os dados e os

    leitores, mas essa funo adquire novos significados com essa enxurrada de dados.

    A funo tradicional seria a explorao desses dados em busca de notcias, o que

    foi facilitado pela tecnologia. E pouco depois a tecnologia facilitou tambm novas

    formas de mostrar essas informaes aos leitores, que, segundo Tufte, conseguem

    sobreviver enxurrada:

    Ns prosperamos em mundos cheios de informao graas s nossasmaravilhosas e cotidianas capacidades para selecionar, editar, isolar,estruturar, destacar, agrupar, formar pares, mesclar, harmonizar, sintetizar,focar, organizar, condensar, reduzir, escolher, categorizar, catalogar,classificar, listar, abstrair, escanear, observar, isolar, discriminar, distinguir,separar, rotular, ordenar, integrar, misturar, verificar, filtrar, ignorar, fazermdias, aproximar, agregar, resumir, dividir em itens, rever, mergulhar,folhear, olhar, ler rapidamente, refinar, enumerar, extrair informaes, fazersinopses e separar o joio do trigo (TUFTE, 1990, p. 50)17.

    16 Open Data a filosofia ou prtica que defende que certos tipos de dados estejam disponveis paraa populao de modo geral, sem restries de patentes nem direitos autorais.17Traduo do autor. Texto original: We thrive in information-thick worlds because of our marvelousand everyday capacity to select, edit, single out, structure, high-light, group, pair, merge, harmonize,synthesize, focus, organize, condense, reduce, boil down, choose, categorize, catalog, classify, list,abstract, scan, look into, idealize, isolate, discriminate, distinguish, screen, pigeonhole, pick over, sort,

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    27/63

    30

    Todos esses fatores apontam para a consolidao das bases de dados

    como produto jornalstico. Nesse aspecto, Barbosa aponta um possvel cenrio

    futuro, fruto da evoluo das bases de dados como produto jornalstico:

    Logo, a nossa tarefa de compreender a atribuio de um novo status paraas BDs [Bases de dados] no jornalismo digital nos leva a considerar que asmudanas conformadas a partir da concepo de bases de dados como umformato e metfora para o jornalismo digital podem gerar o diferencial paraessa modalidade, conduzindoa a uma nova etapa de desenvolvimento.Quem sabe, quarta gerao. (BARBOSA, 2005, p. 11).

    Nessa quarta gerao prevista por Barbosa certamente h espao para as

    bases de dados como formato jornalstico, e, portanto, para a visualizao. Apesar

    de bases de dados e visualizaes no serem objetos necessariamente ligados aojornalismo online, ali onde encontram espao e possibilidades para a criao de

    novas narrativas e a afirmao do digital como meio.

    integrate, blend, inspect, filter, lump, skip, smooth, chunk, average, approximate, cluster, aggregate,

    outline, summarize, itemize, review, dip into, flip through, browse, glance into, leaf through, skim,refine, enumerate, glean, synopsize, winnow the wheat from the chaff and separate the sheep fromthe goats.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    28/63

    31

    4 VISUALIZAO: DA UNIDADE AO CONJUNTO

    4.1 DEFINIO

    Apesar de o termo visualizao j estar associado ao objeto deste trabalho

    grficos complexos que representam grandes volumes de dados tentaremos

    chegar a uma definio ampla o suficiente para abarcar tanto os trabalhos j

    existentes (como os que sero analisados) como os que possam surgir, em um

    processo indutivo, partindo do extremo mais simples, para depois chegarmos a

    exemplos mais complexos, como os analisados neste trabalho.

    Comearemos com uma pergunta de Tufte:

    O mundo complexo,dinmico, multidimensional; o papel esttico, plano. Como representar o rico

    mundo visual de experincia e mensuramentos na mera planolndia? (TUFTE, 1990,

    p. 9)18.

    E com a definio do trabalho de Michael Friendly:

    o termo visualizao de informao geralmente se aplica representaovisual de colees de grande escala de informao no numrica, comoarquivos e linhas de cdigo em programas, bases de dados bibliogrficas,

    redes de relaes na internet, e assim por diante. (FRIENDLY, 2009, p. 2)19

    Mais adiante, Friendly fecha um pouco o conceito, se aproximando do foco

    deste trabalho:

    focamos no domnio, um pouco mais estreito, da visualizao de dados, acincia da representao visual de dados, definida como informao quefoi abstrada de alguma maneira esquemtica, incluindo atributos ouvariveis para as unidades de informao. (FRIENDLY, 2009, p. 2)20

    Em The Language of New Media (MANOVICH 2007) possvel garimparalgumas conceituaes: um mapeamento entre dados discretos e uma

    18Traduo do autor. Texto original: The world is complex, dynamic, multidimensional; the paper isstatic, flat. How are we to represent the rich visual world of experience and measurement on mereflatland?19Traduo do autor. Texto original: the term information visualization is generally applied to thevisual representation of large-scale collections of non-numerical information, such as files and lines ofcode in software systems, library and bibliographic databases, networks of relations on the internet,

    and so forth.20 Traduo do autor. Texto original: we focus on the slightly narrower domain of data visualization,the science of visual representation of data, defined as information which has been abstracted insome schematic form, including attributes or variables for the units of information.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    29/63

    32

    representao visual (p.148), comunicao de dados abstratos atravs do uso de

    interfaces visuais interativas (KEIM et al apud MANOVICH, 2007, p. 148) 21 e

    mapeamento de algumas propriedades dos dados em uma representao visual (p.

    151).

    Essas trs definies implicam na ideia de comunicar dados atravs de uma

    transposio (da linguagem numrica para a visual) na qual, alm de mudar o

    cdigo, necessrio editar o corpus (a base de dados) do que queremos evidenciar

    para que este se adapte a nosso novo cdigo; ou ainda adaptar o nosso cdigo para

    evidenciar melhor o que queremos mostrar do corpus.

    Na TED Talkministrada pelo jornalista e designer David McCandless, do site

    Information is Beautiful, ele fala sobre visualizar informao:

    atravs da visualizao de informao, ns a transformamos [a informao]em uma paisagem que voc pode explorar com seus olhos, uma espcie demapa da informao. E quando voc est perdido na informao, um mapada informao pode ser til.[]visualizar informao como esta uma forma de compresso deconhecimento. uma maneira e espremer uma quantidade enorme deinformao e compreenso em um espao pequeno (McCANDLESS,2010).22

    Por ltimo, temos a opinio de Antony Unwin:

    Porqu visualizar dados importante? A visualizao de dados boa paralimpar dados, para explorar dados [], para identificar tendncias eagrupamentos, para encontrar padres locais, para avaliar modelos deoutput e para apresentar resultados. A visualizao essencial para aanlise exploratria de dados. (UNWIN; THEUS; HOFMANN, 2006, p. 1,2006)23

    interessante notar o conceito de inputoutput (entrada e sada) presente

    nessas definies, nas quais o inputso dados e o output uma visualizao. Issotambm nos remete ao princpio garbage in, garbage out, proveniente da cincia da

    21Manovich cita essa definio para falar de como o termo visualizao encarado por autores dacincia da computao22Traduo do autor: By visualizing information, we turn it into a landscape that you can explore withyour eyes, a sort of information map. And when youre lost in information, an information map is kindof useful. But what it points to is that visualizing information like this is a form of knowledgecompression. It;s a way of squeezing an enormous amount of information and understanding into a

    small space.23Traduo do autor: Why is visualizing data important? Data visualization is good for data cleaning,for exploring data [], for identifying trends and clusters, for spotting local patterns, for evaluatingmodelling output and for presenting results. Visualization is essential for Exploratory Data Analysis.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    30/63

    33

    computao, que diz que a qualidade do output depende da qualidade do input

    (LIDWELL; HOLDEN; BUTLER, 2003, p. 94). Esse princpio se aplica s

    visualizaes (e tambm s bases de dados, quando usadas como formato): para

    que sejam de qualidade, necessrio atentar para a qualidade das bases de dados.

    A partir de todas estas definies, podemos tentar definir o termo

    visualizao como uma representao visual de um nmero geralmente grande

    de dados que possam ser representados numericamente (grifo meu). Porm,

    esta definio gera algumas ambiguidades que serviro para pr o conceito prova:

    4.1.1Quanto grande

    Podemos pensar que um nmero de dados grande quando no pode ser

    entendido por si s e precisa ser comprendido com a ajuda de recursos como

    comparaes ou grficos. O ponto em que um volume de dados se torna

    incompreensvel varia segundo o leitor, mas podemos afirmar que, medida que a

    quantidade de dados a serem lidos aumenta, a capacidade de apreender seu

    significado e poder fazer relaes entre eles diminui. possvel comparar dois

    dados (a cotao do Dlar Comercial em 2 de janeiro de 2012 foi de R$ 1,86 e na

    mesma data de 2011 foi de 1,65), mas a dificuldade aumenta quando colocamos

    mais nmeros (a cotao do Dlar Comercial em janeiro de 2012 foi de R$ 1,869 no

    dia 2, R$ 1,832 no dia 3, R$ 1,827 no dia 4, R$ 1,841 no dia 5, R$ 1,851 no dia 6,

    R$ 1,835 no dia 9, R$ 1,801 no dia 10, R$ 1,801 no dia 11, R$ 1,785 no dia 12,

    R$ 1,790 no dia 13, R$ 1,788 no dia 16, R$ 1,780 no dia 17, R$ 1,767 no dia 18,

    R$ 1,763 no dia 19, R$ 1,759 no dia 20, R$ 1,7521 no dia 23, R$ 1,753 no dia 24,

    R$ 1,7632 no dia 25, R$ 1,744 no dia 26, R$ 1,739 no dia 27, R$ 1,749 no dia 30 e

    R$ 1,747 no dia 31).

    O nmero de dados tambm grande porque a premissa da visualizao

    que os dados sejam exibidos em sua totalidade (MANOVICH, 2007, p. 157), sem

    que haja cortes. Unwin justifica: se um conjunto de dados to grande, porqu

    simplesmente no pegar uma grande amostra? Mas amostras no vo mostrar as

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    31/63

    34

    excees, estruturas locais, ou erros sistemticos nos dados (UNW IN; THEUS;

    HOFMANN, 2006, p. 1)24

    4.1.2O que visual

    Quando o Produto Interno Bruto (PIB) divulgado como variao, e no

    como nmero absoluto, h uma tentativa de representar valores maiores de uma

    maneira mais acessvel, em um processo de intenes similares s da visualizao.

    mais fcil entender que houve um aumento de 7,5% do que saber que em 2009 o

    PIB foi de R$ 3,143 trilhes e em 2010 de R$ 3,675 trilhes. Temos ento umaespcie de visualizao na qual dados numricos so simplificados e representados

    em linguagem oral. Outro exemplo poderia ser uma comparao oral ou metfora,

    como dizer o corao do tamanho de um punho fechado. So artifcios que tm

    uma funo similar de uma visualizao, porque facilitam a compreenso de um

    valor numrico.

    Os exemplos acima geram uma visualizao mental no receptor da

    mensagem. Temos tambm a possibilidade de visualizaes sonoras. Um exemplo

    o infogrfico The Dow Piano, no qual notas mais graves representam nveis mais

    baixos do ndice Dow Jones, a intensidade do som reflete a quantidade de

    operaes e o ritmo das notas representa as semanas. (EDLUND, [2011?]). Outras

    possibilidades so as exploraes sonoras, como o projeto do DJ Ramjac, que

    sobreps, em uma nica faixa sonora, todas as msicas gravadas pelos Beatles

    (RAMJAC, [2011?]); ou o trabalho de Mike Lacher, que sobreps todos os hits de

    Billy Joel (LACHER, [2010?]). Esse tipo de experincia tem pontos em comum com a

    visualizao no que se refere busca de padres, por exemplo. Como mais uma

    experincia de visualizao no visual, temos o projeto de Matthew Epler, Grand

    Old Party (EPLER, 2012), que consta de uma srie de brinquedos sexuaiscom a

    forma do grfico de popularidade dos pr-candidatos republicanos presidncia dos

    Estados Unidos. Nesse caso, a proposta de uma visualizao ttil que faz uma

    analogia sexual com as consequncias de um governo republicano.

    24Traduo do autor. Texto original: You might ask, if a dataset is so large, why not just take a bigsample? But samples will not pick out outliers, local structures, or systematic errors in the data.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    32/63

    35

    Embora os exemplos citados ainda estejam no campo da exceo, o

    surgimento dessas visualizaes no visuais atentam para que o termo visual

    no seja encarado literalmente. Isso aumenta as possibilidades da linguagem da

    visualizao e inclusive permitiria pensar em visualizaes acessveis a deficientes

    visuais, por exemplo.

    4.1.3 Quais dados podem ser representados numericamente

    Como veremos adiante, h vrias formas de representao grfica

    adequadas a vrios tipos de dados. Mas todas essas representaes implicam em

    mostrar quantidades. Se os dados surgem como numricos, no h problemas. Masos dados que no sejam numricos precisam ser transformados em nmeros,

    mesmo que esses nmeros sejam uma tentativa de expressar subjetividades (como

    podem ser notas de 0 a 10 atribudas a filmes) ou uma classificao (dividir animais

    em vertebrados e invertebrados pode ser transformados nas categorias 1 e 2, por

    exemplo). Em toda visualizao comunicada uma quantidade que estar presente

    mesmo que representada de diferentes maneiras.

    Considerando as ambiguidades da definio, podemos encontrar alguns

    exemplos que se encaixariam na ideia de visualizao (apesar de serem bem mais

    simples do que o tipo de trabalho que ser analisado), vejamos:

    Uma pesquisa hipottica que aponta que 450 dos 600 entrevistados so

    torcedores de determinado time pode ser traduzido como 75% dos entrevistados, o

    que pode ser representado com um grfico de pizza.

    A informao de que o PIB brasileiro cresceu 7,5% em 2009, fruto de

    operaes matemticas entre valores de difcil comparao.

    Um mapa localizando uma cidade. A localizao da cidade pode ser

    traduzida em termos de latitude e longitude.

    Uma criana mostrando com as mos o quanto gosta de algum, ou gesto

    similar (Fig. 2).

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    33/63

    36

    Bono Vox batendo palmas em um certo ritmo, representando o fato que a

    cada palma que ele batia uma criana morria na frica ao que algum da plateia

    respondeu ento para de bater!25

    Fig. 2 Exemplo de visualizao subjetiva de dados reais, na figura do Professor Raymundo,personagem de Chico Anysio. Fonte: AUDINCIA, 2012.

    Todos os exemplos citados so redues de vrios dados numricos a um

    nico valor (que no necessariamente expressado como nmero), e tm o objetivode melhorar a compreenso por parte do receptor. Mesmo no sendo to

    necessrias do ponto de vista da compreenso numrica, facilitam a compreenso,

    e podem ter tambm uma funo potica de causar uma reao. Essas

    visualizaes, extremamente simples, so os elementos para comear a construir

    visualizaes mais complexas, nas quais o objetivo de esclarecer a infomao no

    s se mantm mas se torna mais necessrio, j que estamos pensando em milhares

    ou milhes de dados em uma nica visualizao.Voltemos ao trabalho See Something or Say Something (Fig. 1), de Eric

    Fischer (2011) para pr novamente a definio prova, desta vez com uma

    visualizao mais complexa. O trabalho mapeia a localizao de tweets e de fotos

    armazenadas no Flickr. Nele temos um volume grande de tweets e de fotos, que

    configuram um nmero de dados grande, praticamente impossveis de serem

    processados mo ou lidos. Os dados analisados podem ser representados

    25 O fato no verdico, segundo o site especializado em desmentir rumores Snopes (BONO, 2008),mas foi mantido aqui por ser um bom exemplo.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    34/63

    37

    numericamente, j que o lugar onde foi emitido um tweet ou onde foi postada uma

    foto no Flickr transformado em coordenadas GPS j na base de dados dos sites

    (ou na prpria cmera ou celular, no caso das fotos). Por ltimo, temos que os

    dados so representados de maneira visual, com cores definindo o que cada ponto

    e as coordenadas GPS sendo representadas de maneira espacial, refazendo os

    mapas das cidades. Esse trabalho rene as melhores caractersticas de uma

    visualizao, principalmente no que se refere a identificar padres. Os pontos que

    representam fotografias se acumulam em pontos tursticos, e os pontos que

    representam tweets so visveis em lugares de passagem, como o aeroporto do

    Galeo e a ponte RioNiteri. Notemos ainda que o mapa no aparece, e sim

    delineado pela posio dos pontos.

    4.2 DIFERENAS ENTRE VISUALIZAO E INFOGRAFIA

    Dada a proximidade das duas atividades e o uso dos termos no presente

    trabalho, necessrio fazer uma observao sobre as diferenas entre a infografia e

    a visualizao. De Pablos define a infografia de uma maneira ampla: a

    apresentao impressa de um binmio imagem + texto [] qualquer que seja o

    suporte onde se apresente essa unio informativa: monitor, papel, plstico, barro,

    pergaminho, papiro, pedra (DE PABLOS, 1999)26. Um infogrfico poderia, ento,

    conter mais elementos visuais alm das visualizaes, alguns dos quais apontados

    por Gonzalo Peltzer: mapas, smbolos, ilustraes, histrias em quadrinhos, etc27

    (PELTZER, 1991).

    Para exemplificar, foi escolhido o infogrfico "La ballena Franca", de autoria

    de Jaime Serra, publicado pelo jornal argentino Clarn em 1995. A obra foi premiada

    nos prmios Malofiej28 como o melhor infogrfico dos ltimos 20 anos (CLARN,

    2012), e, por isso, representaria um exemplo de como um infogrfico dentro dos

    "cnones" tradicionais da infografia.

    26Traduo do autor. Texto original: "es la presentacin impresa de un binomio imagem + texto [],cualquiera que sea el soporte donde se presente esa unin informativa: pantalla, papel, plstico,barro, pergamino, papiro, piedra."27 Peltzer no usa o termo infogrfico ou infografia com o mesmo sentido que De Pablos, mas aquiforam usados os gneros visuais por ele enumerados por serem bons exemplos das possibilidadesde imagens a que De Pablos se refere.28 Prmios internacionais de infografia, entregues anualmente na Espanha.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    35/63

    38

    Nele, foram destacados quais os elementos que esto dentro do conceito

    aqui abordado de visualizao, ou seja, que so representaes visuais de dados

    numricos. Os outros elementos se encaixam nos elementos visuais apontados por

    Peltzer, mas fogem do conceito aqui abordado de visualizao.

    Fig. 3 Uso de visualizaes no infogrfico "La ballena Franca" (destaques meus). Fonte do original:CLARIN, 2012.

    A definio de De Pablos tambm incluiria trabalhos como o j visto See

    Something or Say Something (Fig. 1), j que alm da visualizao em si, temos um

    elemento textual imprescindvel para sua compreenso, que a explicao de como

    ler a visualizao. Chamar um material com essas caractersticas visualizao

    densa acompanhada de legendas ou instrues de leitura de infogrfico seria

    aceitvel, mas no presente trabalho ser preferido o termo visualizao quando ela

    for predominante.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    36/63

    39

    5 FERRAMENTAS E ASPECTOS TCNICOS

    Uma vez definido o que uma visualizao e qual seu possvel papel dentro

    do jornalismo, possvel comear a considerar os conhecimentos necessrios para

    que ela possa ser feita. possvel relacionar essa necessidade de conhecimento

    com a citada por Wolton:

    O limite aqui a competncia. O acesso a toda e qualquer informao nosubstitui a competncia prvia, para saber qual informao procurar e queuso fazer desta. O acesso direto no suprime a hierarquia do saber e doconhecimento. (WOLTON, 2007, p. 87)

    Transpondo a ideia de Wolton para o campo da visualizao de dados,

    podemos considerar que essa competncia a soma dos diferentes

    conhecimentos necessrios para realizar uma visualizao. E ainda temos a questo

    do acesso direto: quem faz uma visualizao est facilitando o acesso

    informao, reduzindo essa necessidade de competncia prvia da qual Wolton fala.

    Quem faz uma visualizao usa sua competncia para que os leitores no precisem

    usar as suas.

    Ben Fry (2008) define sete passos para chegar a uma visualizao, que

    podem ser agrupados em trs fases: obteno dos dados, escolha da forma de

    visualiz-los e conseguir qualidade tcnica na visualizao. Esse agrupamento foi

    feito para poder analisar, simultaneamente, os conhecimentos e ferramentas

    necessrias em cada fase. O prprio Fry fala que no se pode ser escravo desses

    passos29 (FRY, 2008, p. 6), mas sero analisados dessa maneira para abarcar o

    maior nmero possvel de situaes.

    5.1 OBTENO DOS DADOS

    Dentro dos sete passos de Fry, os primeiros quatro esto diretamente

    ligados edio dos dados. O primeiro obter os dados (acquire): obtenha os

    dados, seja de um arquivo em um disco ou de uma fonte em uma rede (FRY, 2008,

    p. 5)30. Neste momento, a dificuldade medida pela maneira em que os dados esto

    29Traduo do autor. Texto original: these steps cant be followed slavishly.30Traduo do autor. Texto original: Obtain the data, whether from a file on a disk or a source over anetwork.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    37/63

    40

    disponibilizados. Por exemplo, se os dados esto disponibilizados em formato pdf,

    necessrio convert-los para um formato de texto. Ou, se os dados estiverem em

    suporte fsico, necessrio digitaliz-los.

    O segundo o processamento dos dados (parse): d uma estrutura ao

    significado dos dados, e organize-os em categorias (FRY, 2008, p. 5)31. uma

    primeira filtragem dos dados, til para saber com que tipos de dados estamos

    lidando.

    O terceiro passo filtrar (filter): exclua tudo exceto as informaes de

    interesse32 (FRY, 2008, p. 5). Tanto para este passo como para o anterior, uma

    ferramenta til a tcnica dos cinco cabides de Richard Saul Wurman (2001, p. 40

    45), que diz que h cinco maneiras de organizar a informao: por localizao,alfabtica, cronolgica ou de hierarquia.

    O quarto passo minerar (mine): aplique mtodos oriundos das estatsticas

    ou minerao de dados como uma forma de identificar padres ou colocar os dados

    em um contexto matemtico33 (FRY, 2008, p. 5). Isso inclui clculo de mdias,

    medianas, desvios de padro, transformar nmeros absolutos em relativos. Aqui

    devemos cuidar para no haja reduo nos dados (MANOVICH, 2007, p. 157).

    5.1.1 Ferramentas para a manipulao dos dados

    A opo mais bvia para manipulao de grandes volumes de dados so as

    planilhas eletrnicas, como Excel e OpenOffice. possvel usar um software de

    banco de dados, como o Microsoft Access ou o sistema MySQL. Tambm pode ser

    necessrio o uso de editores de texto capazes de processar grandes volumes de

    dados, como o TextWrangler, da BareBones. Em alguns casos, pode ser necessrio

    fazer uso de linguagens de programao. Yau (2011) cita o uso da linguagem

    Python para fazer uma ferramenta especfica para extrair dados de um site, na falta

    de softwares prontos que realizassem essa tarefa.

    31 Traduo do autor. Texto original: Provide some structure for the datas meaning, and order it into

    categories.32Traduo do autor. Texto original: Remove all but the data of interest.33Traduo do autor. Texto original: Apply methods from statistics or data min ing as a way to discernpatterns or place the data in mathematical context.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    38/63

    41

    5.2 APRESENTAO DOS DADOS

    O quinto passo de Fry representar (represent). Fry sugere escolher um

    modelo de base entre formatos bsicos e conhecidos, como grficos de linha ou de

    barras, grficos de variao de cor, mapas e plantas, e um longo etctera.

    Geralmente essa forma bsica escolhida adequada para mostrar uma das

    dimenses da base de dados, e por isso modificaes podem ser necessrias, como

    aponta Manovich:

    Acredito que a maioria das prticas de visualizao de informao dasegunda metade do sculo XVIII at hoje seguem o mesmo princpio -reservando arranjo espacial (podemos cham-lo de layout) para as

    dimenses mais importantes dos dados, e usando outras variveis visuaispara as dimenses remanescentes (MANOVICH, 2007).

    Assim como necessrio experimentar com vrias formas de representao,

    pode ser necessrio retornar edio dos dados.

    neste passo que as informaes latentes comeam a ficar evidentes. Essa

    apresentao dos dados pode ser suficiente se a visualizao estiver sendo usada

    como ferramenta do jornalista e no como um produto final.

    Temos ento o sexto passo, refinar (refine), que diz melhore arepresentao bsica para deix-la mais clara e mais atraente). O refinamento da

    visualizao pode implicar em mudanas na estrutura bsica escolhida, cruzando

    caractersticas de mais tipos de visualizao, ou em mudanas na escolha dos

    dados representados, talvez graas percepo da possibilidade de incluir mais

    variveis visuais para representar mais dados. Novamente pode ser necessrio

    voltar aos dados, para escolher novos ou substituir dados que no estejam

    funcionando.Deixar a informao mais atraente no quer dizer decor-la. Tufte

    categrico ao se manifestar contra qualquer tipo de decorao nos dados em si:

    Se seconder por trs de chartjunk menosprezar tanto a informao comoa audincia. Os defensores do chartjunkimaginam que nmeros e detalhesso chatos, desinteressantes e tediosos, e precisam de ornamentos para ter

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    39/63

    42

    vida. A decorao cosmtica, que frequentemente distorce os dados, nuncavai salvar a falta de contedo (TUFTE, 1990, p. 34). 34

    5.2.1 Ferramentas para fazer a apresentao dos dados

    Novamente os softwares de planilhas de clculo so teis. Eles tm a

    possibilidade de gerar grficos a partir dos nmeros presentes na planilha. Esses

    grficos podem ser impressos ou transpostos para programas de edio de imagens,

    como o Adobe Illustrator, para serem finalizados.

    Temos tambm ferramentas de visualizao disponveis na web, que

    permitem que o usurio envie dados e escolher de que maneira eles sero

    visualizados. Exemplo disso o site Many Eyes, com vrias opes de visualizao,e o site Wordle, que gera nuvens de tags. Podemos incluir nesta categoria o

    software Tableau, que exige que o usurio baixe um programa para fazer as

    visualizaes antes de disponibiliz-las no site, e o Google Maps, que disponibiliza

    APIs que podem ser teis.

    Tanto as planilhas como as ferramentas da web esbarram em uma questo

    levanteda por Fry: uma ferramenta que tem usos genericos vai produzir somente

    grficos genricos, que podem ser decepcionantes se os grficos no se adaptam asua base de dados35(2008, p. vii). Para certas situaes, o mais indicado

    construir uma ferramenta especfica para as necessidades, e isso pode ser feito com

    programao.

    H vrias linguagens de programao que podem ser usadas, mas

    destacaremos aqui a escolhida por Fry para ensinar a fazer visualizaes:

    Processing, uma linguagem inicialmente concebida para auxiliar no aprendizado de

    programao, e por isso mostrava resultados visuais. Simples e fcil de aprender, a melhor maneira para que artistas e designers ou jornalistas comecem a

    programar.

    34Traduo do autor. Texto original: Lurking behind chartjunk is contempt both for information and forthe audience. Chartjunk promoters imagine that numbers and details are boring, dull, and tedious,

    requiring ornament to enliven. Cosmetic decoration, which frequently distorts the data, will naversalvage an underlying lack of content.35Traduo do autor. Texto original: a tool that has generic uses will produce only generic d isplays,which can be disappointing if the displays do not suit your data set

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    40/63

    43

    5.3 CONSEGUIR QUALIDADE TCNICA NA REPRODUO DA VISUALIZAO

    O ltimo passo a interao (interact): acrescente mtodos para manipular

    os dados ou controlar quais aspectos sero visveis (FRY, 2008, p. 5).

    Considerando que o livro de Fry se trata especificamente de visualizaes

    construdas na linguagem Processing, que tm a possibilidade de serem interativas,

    podemos tornar este passo mais genrico e pensar nele como o momento de avaliar

    qual o suporte mais adequado para a visualizao gerada.

    A interao no algo obrigatrio em uma visualizao, e s vezes pode

    complicar desnecessariamente a experincia. o caso do infogrfico animado do

    lanador Mariano Riviera, publicado pelo NYT (CARTER, S.; GRAHAM R.; WARD,J., 2010). Shan Carter, editor de interao do jornal, afirma:

    decidimos que seria mais interessante mostrar aos usurios o qu erainteressante, mais do que exigir que eles o encontrassem por si mesmos.Estavamos tentando mostrar o que faz de Rivera o melhor deixar que umusurio navegasse por todos os seus lanamentos no era a maneira maisefetiva de fazer isso.36 (CARTER apud GONZLEZ VEIRAS, 2010)

    5.3.1 Escolha do suporte

    Como vimos anteriormente, uma visualizao uma forma de outputde uma

    base de dados editada para esse fim. Esse outputpode se dar de trs maneiras,

    segundo Manovich (2007): esttica, tpica de suportes impressos; dinmica, com

    presena de elementos animados, mas sem possibilidade de interao; e interativa,

    onde o leitor interage fazendo escolhas sobre quais dados ver ou como v-los.

    Notemos que essa classificao no est diretamente ligada ao suporte, j que

    possvel que visualizaes estticas sejam usadas na internet ou vdeo, assim como

    possvel considerar as possibilidades de interao que um leitor tem com o papel.

    Cada uma dessas formas de output tem caractersticas que no

    necessariamente devem ser pensadas como limitadoras; pelo contrrio, devem ser

    consideradas as vantagens especficas de cada uma. Visualizaes em papel, por

    exemplo, podem se aproveitar dos sistemas de pr-impresso, que alcanam uma

    36Traduo do autor. Texto original: we decided it would be more interesting to show users what wasinteresting rather than requiring them to find it themselves. We were trying to show what makes Riverathe best allowing a user to browse all his pitches wasnt the most effective way of doing that.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    41/63

    44

    qualidade de at 2400 dpi (pontos por polegada) quando se utilizam tintas puras

    (TUFTE, 1990, p. 8195). J as telas de cristal lquido mais recentes chegam a 326

    dpi, como a tela retina do iPhone, mas oferecem muito mais possibilidade de cores.

    Outra peculiaridade do papel seu tamanho: uma folha de jornal tem em mdia 30

    centmetros de largura x 52 centmetros de altura, o que equivaleria a uma tela de

    cristal lquido de 32 polegadas, mas com uma resoluo muito maior. Ainda

    possvel escolher as possibilidades de interao inclusive ldicas quando

    usamos meios eletrnicos, as possibilidades de movimento quando usamos vdeo e

    as possibilidades de interao do papel, que passam pela manipulao que o leitor

    faz do objeto.

    A alta resoluo semntica citada anteriormente (FIDALGO, 2006) precisaser acompanhada por dispositivos que permitam exibi-la; o que inclui o papel. As

    telas de cristal lquido j alcanam 326 pixels por polegada (no caso do iPhone 4,

    por exemplo). A tecnologia Oled37 permite telas com uma taxa de contraste de

    1:1000000, o que permite maior quantidade de cores e tons perceptveis. Manovich

    cita um dispositivo de visualizao, composto de 70 monitores de cristal lquido, que

    chega a 35.840 por 8.000 pixels. E a impresso, a rigor, permite resolues de at

    2400 dpi, o que ainda muito superior s telas. Mesmo que dados representadosgraas a essas tecnologias sejam difceis de serem vistos, necessrio que estejam

    ali. O acmulo de pontos minsculos gera uma rea que significa algo. Esses dados

    tem que ser sentidos, mais do que lidos. Estes recursos permitem que as

    visualizaes sigam o princpio de visualizao sem reduo de Manovich (2007).

    Porm, possvel usar recursos de hipertexto para superar os limites do

    suporte e acrescentar camadas de informao: zoom ou mouseover38 para ler dados.

    No papel, possvel usar vrias folhas de papel e referncias. Esses elementos dehipertexto podem tanto acrescentar camadas de informao como ter uma funo

    similar de uma legenda.

    O importante no tentar que um suporte tenha as caractersticas de outro.

    No possvel fazer zoom numa folha de jornal, nem mostrar uma imagem do

    tamanho de um poster em uma tela de celular.

    37 Sigla para Organic Light-Emitting Diode(diodo orgnico de emissor de luz)38 Ato de passar o cursor do mouse por cima de algum elemento de um produto multimdia, sem clicar.

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    42/63

    45

    6 ANLISE DE INFOGRFICOS E VISUALIZAES

    6.1 HOW MARIANO RIVERA DOMINATES HITTERS, THE NEW YORK TIMES

    Fig. 4 Frame do infogrfico em vdeo "How Mariano Rivera Dominates Hitters". Fonte: CARTER;GRAHAM; WARD, 2010.

    O infogrfico, publicado em 29 de junho de 2010 no site do jornal nova-iorquino

    The New York Times, apresentado em forma de vdeo, com 2 minutos e 40

    segundos de durao. Se trata de um vdeo normal, sem nenhuma possibilidade de

    interao. Foi produzido por Shan Carter, Graham Roberts e Joe Ward (CARTER;

    GRAHAM; WARD, 2010) e o processo de produo foi descrito pelo chefe de

    grficos do jornal (GONZLEZ VEIRAS, 2010).

    Fig. 5 trecho da base de dados dos lanamentos de Rivera. Fonte: GONZLEZ VEIRAS, 2010.

    A base de dados usada consiste nos dados de 1,3 mil lanamentos feitos pelo

    jogador Mariano Rivera durante 2009, que foram compilados pela empresa

    Complete Game Consulting (Fig. 5). Para visualizar esses dados, a equipe do jornal

  • 7/29/2019 Visualizao de dados e seu uso no Jornalismo

    43/63

    46

    desenvolveu, usando a linguagem Processing, um pequeno programa para poder

    dar forma a esses dados (Fig. 6). A visualizao os ajudou a decidir quais dados

    tinham que ser mostrados e como deveriam mostr-los (GONZLEZ VEIRAS,

    2010)39 . Segundo um dos autores do infogrfico, Shan Carter, em entrevista a

    Xaqun Gonzlez Veiras:

    Escrevemos o aplicativo para poder explorar os dados e experimentar comdiferentes modelos de interao, diz Shan. Apesar de que todos sabemosque h uma certa beleza em explorar os dados por si prprio, no fim dascontas, continua Shan, decidimos que seria mais interessante mostrar aousurio o que era interessante, ao invs de faz-lo descobrir por si mesmo orelevante. A inteno era mostrar o qu fazia de Rivera o melhor e deixaro usurio explorar todos seus lanamentos no era a maneira mais eficientede consegui-lo (GONZLEZ VEIRAS, 2010).40

    Decidido o formato do infogrfico, outras instncias de infogrficos foram

    produzidas, como as animaes explicando os diferentes tipos de lanamentos

    feitos pelo arremessador Mariano Ri