TADI – Tratamento e Análise de Dados/Informações Prof ... · Hamlet é a história de um...
Transcript of TADI – Tratamento e Análise de Dados/Informações Prof ... · Hamlet é a história de um...
Aula 7 – Estatística Descritiva, tabelas e gráficos
- Tabelas de freqüência (absoluta ou relativa,
cumulativa ou não)
- Gráficos de Setores
- Gráfico de barras: freqüência absoluta ou relativa
- Histogramas: freqüência absoluta ou relativa de dados quantitativos
- Ogiva: freqüência cumulativa
- Diagrama de Dispersão: a relação entre duas variáveis quantitativas
- Gráfico temporal: evolução de uma dada quantidade ao longo do tempo
TADI – Tratamento e Análise de Dados/Informações Prof. Camilo Rodrigues Neto
Vídeos
• 200 países, 200 anos, 4 minutos • http://www.youtube.com/watch?gl=BR&v=Qe9Lw_nlFQU
• Hans Rosling: New insights on poverty and
life around the world • http://www.youtube.com/watch?v=YpKbO6O3O3M&feature=related
Bibliografia para a segunda parte do curso
Seguiremos os seguintes livros:
• MAGALHÃES, Marcos N. e LIMA, Antonio C. P. Noções de probabilidade e estatística. São Paulo: Edusp, 2005, 391 p.
• BUSSAB, Wilton O. e MORETTIN, Pedro A. Estatística básica. São Paulo: Ed. Saraiva, 2004, 526 p.
• GOULD, Stephen Jay. A mediana não é a mensagem.
Disponível em www.each.usp.br/camiloneto
• cópia das transparências;
• texto do Gould, A mediana não é a mensagem.
Problema
Vamos supor que você deseja determinar:
• se a prática de exercícios pela mãe durante a
gravidez é benéfica ao bebê e;
• se quanto mais exercício a mãe fizer, melhor
para o bebê.
Como medida da saúde do recém-nascido, você
está utiliza o peso do bebê ao nascer.
Coleta e registro dos dados
Você registrou o peso de 462 crianças e o quanto a mãe praticou exercícios durante a gravidez (os primeiros 16 dados estão na tabela ao lado).
Você precisa interpretar e obter alguma conclusão destes dados.
02/06/2014 Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 10
Perguntas que se quer responder
Existem muitas perguntas que você pode querer responder a partir
dos dados.
Por exemplo: que pesos são comuns para recém-nascidos? quanto uma
grávida costuma se exercitar? o grau de exercício influencia no
peso do bebê? ... etc.
Algumas perguntas são fundamentais:
• Estamos interessados apenas no grupo observado ou o grupo deve fornecer informações sobre um conjunto maior de indivíduos (amostra)?
• Que tipos de variáveis estão presentes e o que pode ser feito com elas?
• Quais perguntas queremos responder? De que forma os dados podem ajudar (ou não) a responder estas perguntas?
Resumos
A simples visualização de todos os dados, ainda que contenha toda a informação, muitas vezes, não diz nada. Existe mais ali do que nosso cérebro consegue processar.
É imprescindível ter técnicas de resumo que passem informações de uma forma clara e fácil de entender para podermos resolver problemas de forma eficiente.
Resumos sempre escondem algo
Hamlet é a história de um príncipe atormentado que morre no final, assim como todos os personagens principais.
O Senhor dos Anéis é a história de um grupo de pessoas que viajam de um lado para o outro.
• O resumo pode estar correto, mas ainda assim não responder
à pergunta de interesse. • Há um balanço delicado entre a concisão (e clareza) e a
quantidade de informação transmitida. • A decisão sobre quais informações são importantes e quais
não são é fundamental.
Estatística descritiva: resumindo dados
A Estatística Descritiva lida com as formas de
obter informações úteis a partir de um
conjunto de dados, de forma a facilitar a
resolução de problemas.
Ela o faz a partir de medidas resumo, gráficos e
tabelas.
Tipos de Variáveis
Antes de resumir algo, precisamos saber sobre o que
estamos falando, ou seja, qual o tipo de variável
estamos interessados. As variáveis podem ser:
• Qualitativas: uma variável é qualitativa quando
seus possíveis valores são categorias;
• Quantitativas: são as que podem ser medidas
em uma escala numérica que faz sentido
(possuem valores quantitativos).
Variáveis Qualitativas
Medem uma qualidade, podendo ser
• ordinais: possuem uma ordem natural, como o
índice de aprovação de um político (péssimo,
ruim, regular, bom ou ótimo), o grau de
instrução e o nível socioeconômico;
• nominais: não possuem uma ordem natural,
como o sexo de uma pessoa, a carreira e a
região onde mora.
Variáveis Qualitativas
Tanto às variáveis de tipo nominal como as de tipo ordinal
podem, por razões de conveniência, ser associados
valores numéricos às diferentes categorias.
Note que estes valores numéricos não tem significado como
tal, nem mesmo no caso de variáveis de tipo ordinal.
Por exemplo, poderíamos associar os valores 1 e 2 às categorias masculino
e feminino da variável sexo.
Ou os valores 1, 2 e 3 às categorias baixo, médio e alto do nível
socioeconômico.
Mas os números 1 e 2 no primeiro caso e 1, 2 e 3 no segundo não são nada
mais que símbolos para representar as categorias.
Variáveis Quantitativas
Medem uma quantidade, podendo ser:
• discretas: quando os possíveis valores são contáveis, como
o número de alunos em uma sala, o número de partículas em
um caixa, o número de filhos, o número de acidentes em um
mês, o número de bactérias por litro de leite e o número de
cigarros fumados por dia;
• contínuas: quando os possíveis valores são números reais
dentro de um intervalo, como peso (balança), altura
(régua), tempo (relógio), pressão sistólica, nível de açúcar
no sangue e pressão arterial.
Mudança do tipo de variável
Eventualmente, podemos mudar o tipo de algumas variáveis,
redefinindo os seus valores.
Por exemplo, poderíamos transformar a variável altura
(quantitativa contínua) em categorias ordenadas (baixo, médio
e alto), ou em categorias não ordenadas (altura padrão e
altura fora do padrão).
Podemos também facilmente passar de uma variável contínua a
uma variável discreta simplesmente por uma mudança de
escala de medida.
O peso medido em quilogramas, por exemplo, passa a ser uma
variável discreta.
A variável idade, medida em anos completos, é quantitativa
(discreta); mas, se for informada apenas a faixa etária (0 a 5
anos, 6 a 10 anos, etc...), é qualitativa (ordinal).
O peso dos lutadores de boxe, uma variável quantitativa
(contínua) se trabalhamos com o valor obtido na balança, mas
qualitativa (ordinal) se o classificarmos nas categorias do boxe
(peso-pena, peso-leve, peso-pesado, etc.).
Outro ponto importante é que nem sempre uma variável
representada por números é quantitativa: o número do
telefone de uma pessoa, o número da casa e o número de sua
identidade.
Mudança do tipo de variável
Classificação de uma variável
Variáveis Qualitativas
Variáveis Qualitativas podem ser resumidos na forma de gráficos de barras e tabelas, mas por não serem quantidades de algo, existem várias operações que não fariam sentido se aplicadas (como somar), mesmo se as variáveis se apresentarem na forma de um número (o número do RG de uma pessoa, por exemplo).
Tabela de Frequência
Mostra a freqüência com que cada observação
aparece nos dados (também pode se referir a
classes de observações).
• Freqüência absoluta: número de eventos
observados de um tipo
• Freqüência relativa: dada em porcentagem
(ou como fração).
Tabela de Freqüência
Indica a freqüência observada (relativa ou absoluta).
No exemplo, se queremos saber, dentre as mulheres estudadas, quantas se encontram em cada categoria de exercício, obtemos a tabela:
Exercício
frequência
absoluta
nenhum 185
mudando 213
baixo/ moderado 49
alto 15
Total 462
02/06/2014 Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 31
Tabela de Freqüência
Indica a freqüência observada (relativa ou absoluta).
No exemplo, se queremos saber, dentre as mulheres estudadas, quantas se encontram em cada categoria de exercício, obtemos a tabela:
Exercício
frequência
absoluta
frequência
relativa
nenhum 185 40,04%
mudando 213 46,10%
baixo/ moderado 49 10,61%
alto 15 3,25%
Total 462 100%
Tabela de Freqüência
Indica a freqüência observada (relativa ou absoluta). No exemplo, se queremos saber, dentre as mulheres estudadas, quantas se encontram em cada categoria de exercício, obtemos a tabela:
Exercício
frequência
absoluta
frequência
relativa
nenhum 185 40,04%
mudando 213 46,10%
baixo/ moderado 49 10,61%
alto 15 3,25%
total 462 100,00%
Gráficos de Barras
0%
10%
20%
30%
40%
50%
nenhum mudando baixo/ moderado alto
Fre
qüên
cia
rela
tiva
(%
)
Nível de Exercício
0%
5%
10%
15%
20%
25%
30%
35%
40%
45%
50%
nenhum mudando baixo/ moderado alto
Fre
qüên
cia
rela
tiva
(%
)
Nível de Exercício
Gráficos de Barras
De volta ao problema inicial
Com base no que discutimos, podemos ter, como primeira análise,
um gráfico que mostre o peso médio dos bebês em cada
situação diferente para as mães.
Teríamos então:
3200
3300
3400
3500
3600
3700
3800
nenhum mudando baixo/ moderado alto
Peso
Exercício
Qual a conclusão?
3200
3300
3400
3500
3600
3700
3800
nenhum mudando baixo/ moderado alto
Peso
Exercício
Será que o ordem das classes está correta?
3200
3300
3400
3500
3600
3700
3800
nenhum baixo/ moderado mudando alto
Pe
so
Exercício
Ou será que ajustando a escala a conclusão
seria a mesma?
0
500
1000
1500
2000
2500
3000
3500
4000
nenhum mudando baixo/ moderado alto
Pe
so
Exercício
• Barras sempre da mesma
altura, independentemente
da fração representada.
Gráfico de Setores (Pizza)
nenhum
mudando
baixo/ moderado
alto
Embora muito utilizado, pesquisas sistemáticas sobre a capacidade de interpretação dos resultados mostrados em gráficos de setores mostram que se trata de uma das piores formas de representação gráfica.
Construindo um gráfico de setores
1. As áreas do gráfico devem ser diferenciadas por cores e/ou hachuras;
2. Ao apresentar vários gráficos de setores em datas diferentes ou em formas equivalentes, modifique a área dos círculos para que seja preservada a proporcionalidade entre os valores.
O valor é representado pelo “raio” ou pela “área”?
- o raio dobra da direita para a esquerda
- a área quadruplica da direita para a esquerda
400 100 25
área = pi.r^2
Dados Quantitativos
Variáveis quantitativas podem ser resumidos na
forma de gráficos (histogramas) e tabelas ou a
partir de medidas resumo (Média, Moda,
Mediana, Desvio Padrão, etc.)
Métodos Gráficos: Histograma
Uma forma de apresentar dados quantitativos é o
histograma, com os dados classificados por classes.
O histograma se parece com um gráfico de barras, mas
possui algumas diferenças.
O objetivo é visualizar de que forma os dados se
distribuem pelos diversos valores observados (onde é
mais comum, onde é mais raro).
02/06/2014 Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 48
Tabela de Freqüências
Bloco Freqüência % cumulativo
2000 a 2100 0 0,00%
2100 a 2200 1 0,22%
2200 a 2300 2 0,65%
2300 a 2400 1 0,87%
2400 a 2500 5 1,95%
2500 a 2600 3 2,60%
2600 a 2700 10 4,76%
2700 a 2800 7 6,28%
2800 a 2900 16 9,74%
2900 a 3000 13 12,55%
3000 a 3100 21 17,10%
3100 a 3200 31 23,81%
3200 a 3300 25 29,22%
3300 a 3400 29 35,50%
3400 a 3500 30 41,99%
3500 a 3600 40 50,65%
3600 a 3700 35 58,23%
3700 a 3800 36 66,02%
3500 a 3600 40 50,65%
3600 a 3700 35 58,23%
3700 a 3800 36 66,02%
3800 a 3900 39 74,46%
3900 a 4000 28 80,52%
4000 a 4100 23 85,50%
4100 a 4200 24 90,69%
4200 a 4300 11 93,07%
4300 a 4400 14 96,10%
4400 a 4500 9 98,05%
4500 a 4600 4 98,92%
4600 a 4700 2 99,35%
4700 a 4800 2 99,78%
4800 a 4900 1 100,00%
4900 a 5000 0 100,00%
5000 a 5100 0 100,00%
Total 462 100,00%
Histograma do Peso dos bebês
Peso dos Bebês
0
5
10
15
20
25
30
35
40
45
2000
2200
2400
2600
2800
3000
3200
3400
3600
3800
4000
4200
4400
4600
4800
5000
Bloco
Fre
qü
ên
cia
Ogiva
Por vezes, queremos saber quantos resultados
existem abaixo de um certo número (frequência
cumulativa).
Este resultado pode ser apresentado na forma
gráfica através de um gráfico conhecido por
Ogiva.
A partir da tabela de freqüência cumulativa (absoluta ou relativa)
Ogiva (distribuição cumulativa) do peso dos bebês
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%2000
2200
2400
2600
2800
3000
3200
3400
3600
3800
4000
4200
4400
4600
4800
5000
Bloco
Fre
qü
ên
cia
A quantidade de petróleo coletada está aumentando diariamente, como também está a de petróleo derramado!
O total coletado sempre
aumentará, o importante é o
valor coletado diariamente.
Assassinatos das 10 maiores
cidades dos EUA em 1998
Chicago 703
Nova York 633
Detroit 430
Los Angeles 426
Filadelfia 338
Houston 254
Dallas 252
Fênix 185
San Antônio 89
San Diego 42
Qual o número de habitantes em cada uma das cidades?
Tabelas: mais um exemplo
Forma mais indicada
1995 1998 Net Change
Detroit 47,6 43,0 - 4,6
Chicago 30,0 25,6 - 4,4
Filadelphia 28,2 23,3 - 4,9
Dalas 26,5 23,1 - 3,3
Los Angeles 24,5 11,8 -12,7
Fênix 19,7 15,1 - 4,6
Houston 18,2 14,1 - 4,1
New York 16,1 8,6 - 7,5
San Antonio 14,2 8,1 - 6,1
San Diego 7,9 3,5 - 4,4
Taxas de Assassinatos nas 10 maiores cidades dos
EUA, 1995-98
fontes: Statistical Abstract 2000, CD-Rom, tabela 332; e
Bureau of Justice Statistics:
http://w w w .ojp.usdoj.gov/bjs/data/cities92.w k1
*Assassinatos por 100,000 habitantes
Chicago 703
Nova York 633
Detroit 430
Los Angeles 426
Filadelfia 338
Houston 254
Dallas 252
Fênix 185
San Antônio 89
San Diego 42
Frequência Cumulativa
Mede freqüência absoluta ou relativa até um
certo ponto e não apenas em um valor.
Por exemplo, número de pessoas que tem
escolaridade igual ou menor que ensino médio
(não apenas igual a).
Frequência Cumulativa
Basta somar as freqüências das diversas classes
dadas na tabela de freqüências temos:
Exercício
frequência
absoluta
frequência
relativa
nenhum 185 40,04%
mudando 398 86,15%
baixo/ moderado 447 96,75%
alto 462 100,00%
Total 462 100%
Diagrama de Dispersão
Mostra a relação entre duas variáveis
quantitativas.
Cada par observado de duas variáveis (x,y) é
marcado como um ponto a partir de suas
coordenadas.
Não una os pontos!
-50000
0
50000
100000
150000
200000
250000
-50000 0 50000 100000 150000 200000 250000
Salá
rio
da E
sp
osa (
reais
)
Salário do Marido (reais)
Correlação não significa causalidade http://matizes.escondidos.zip.net/arch2007-01-14_2007-01-20.html
(em 29/5/2010)
Correlação não significa causalidade http://matizes.escondidos.zip.net/arch2007-01-14_2007-01-20.html
(em 29/5/2010)
Gráfico Temporal ou Seqüencial
Mostra a evolução de uma variável ao longo do
tempo.
É criado da mesma forma que o diagrama de
dispersão, afinal é um diagrama de dispersão
onde a variável x é o tempo.
Neste caso, pode-se unir pontos consecutivos.
Gráfico Temporal ou Seqüencial
Juros Americanos
0,00%
4,00%
8,00%
12,00%
16,00%
20,00%
1960 1965 1970 1975 1980 1985 1990 1995
Ano
Ta
xa
A coleta de dados, a tabela de freqüências e os gráficos são apenas os passos iniciais da análise estatística.
O trabalho começa agora, ao apresentar e testar hipóteses explicativas para os padrões observados.
Gráfico Temporal ou Seqüencial International Journal of Bifurcation and Chaos
Volume: 21, Issue: 2 (February 2011)
PREDICTING CLIMATE TIPPING AS A NOISY BIFURCATION: A REVIEW,
J. MICHAEL T. THOMPSON and JAN SIEBER Page: 399-423
Gráfico Temporal ou Seqüencial
Sarampo
Explique o que pode estar escondido nessa afirmação
Faculdade A afirma que, em média, o aluno
formado ali em 95, recebe, no total,
R$21.123,45 por mês.
Explique o que pode estar escondido nessa afirmação
Um estudo recente revelou que os casais
europeus escovam os dentes, em média, 0,97
vezes por dia. O mesmo estudo realizado no
Brasil apresentou um resultado médio de 3,21
vezes por dia.
Explique o que pode estar escondido nessa afirmação
As estatísticas mostram claramente que os
aviões estão se tornando cada vez menos
seguros. Mais pessoas morreram em acidentes
aéreos na última década do que na década de
20!
Explique o que pode estar escondido nessa afirmação
O consumo de uísque escocês faz bem a saúde.
Foi verificado em uma pesquisa realizada no
Brasil que pessoas que bebem uísque escocês
regularmente vivem, em média, mais do que o
restante da população.
Explique o que pode estar escondido nessa afirmação
No ano passado, o grupo onde a doença X
cresceu mais foi o de adolescentes entre 12
e 14 anos.
Explique o que pode estar escondido nessa afirmação
A propaganda de uma determinada marca de
espremedor de sucos afirma que o seu
espremedor espreme 26% a mais de suco,
resultado comprovado por testes de
laboratório.
Explique o que pode estar escondido nessa afirmação
A taxa de mortalidade da marinha americana durante a
guerra hispano-americana foi de 9 a cada 1.000.
Durante o mesmo período da guerra, a taxa de
mortalidade entre civis na cidade de Nova Iorque foi
de 15 a cada 1.000. Portanto, entrar para a marinha,
mesmo durante uma guerra, tornaria a vida de uma
pessoa mais segura.
Explique o que pode estar escondido nessa afirmação
Um novo programa para reabilitação de prisioneiros antes de eles
serem soltos está sendo testado na Califórnia. O objetivo é
reduzir a taxa de reincidência – a percentagem daqueles que
retornam à prisão até dois anos depois de serem postos em
liberdade. O programa envolve vários meses de treinamento em
um acampamento no estilo militar, com uma disciplina bastante
rígida. A admissão ao programa é voluntária. De acordo com o
porta-voz da prisão: “Aqueles que fazem o treinamento militar
tem menor chance de retornar à prisão do que os outros
detentos”.
Explique o que pode estar escondido nessa afirmação
Um pai preocupado leu em uma revista que, em
média, os bebês começam a andar por volta
de 12 meses. Como o seu filho já completou
13 meses e ainda não anda, ele conclui que a
criança deve ter algum tipo de problema de
desenvolvimento.
Nome dos eixos
Informações devem ser úteis para quem as for usar
7,14 - 1,89 = 5,25
É R$1,89
Para simplificar, eu vou te dar R$7,14.
Eu sinto uma obrigação profissional de tornar as coisas fáceis para as pessoas.
Desce
o 3
Quando não se entende
de estatística ...
E aqui está um gráfico que mostra como você veria uma cadeia de montanhas se a olhasse através de uma raquete de tênis.
Não some porcentagens
21% dos rapazes e 30% das garotas me apóiam, portanto eu devo conseguir 51% dos votos.
Vote em mim para presidente do clube de Matemática
Ler para a próxima aula
• Disponível no Grupo
• Texto sobre estatística:
• A mediana não é a mensagem, Stephen Jay Gould
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 90
Bibliografia
• MAGALHÃES, Marcos N. e LIMA, Antonio C. P. Noções de probabilidade e
estatística. São Paulo: Edusp, 2005, 391 p.
• BUSSAB, Wilton O. e MORETTIN, Pedro A. Estatística básica. São Paulo:
Ed. Saraiva, 2004, 526 p.
• GOULD, Stephen Jay. A mediana não é a mensagem. In: CASTRO, Ricardo.
SIMPLESMENTE, Disponível em: http://simplesmente.com/ Acesso em: 20
set. 2007.
• TUFTE, Edward R., The visual display of quantitative information,
Connecticut: Graphics Press, 2001, 196 p.
• DORIN, Alan. Information Design. In: Multimedia Programming in Java,
Disponível em: http://www.csse.monash.edu.au/~cema/courses/CSE5910/
lectureFiles/lecture3b.htm, Acesso em: 11 jan.2008.
• LUO, Yan. Information and Presentation Styles. In: User Interface Design and
Programming. Disponível em: http://www.evl.uic.edu/aej/422/week02.html,
Acesso em: 5 dez. 2007.
02/06/2014
TADI – Tratamento e Análise de
Dados/Informações
Prof. Camilo R. Neto
Aula 10 - Representação gráfica da informação (parte 2)
- Gráficos, uma visão ampla
- O que são gráficos?
- Evolução da representação gráfica
- Quais são seus propósitos?
Hieronymus Bosch (1450 - 1516)
02/06/2014
Programa TADI
Tratamento e análise de dados/informações / Prof. Camilo 92
1. Conhecimento confiável e Crenças duvidosas: vendo o que se espera ver
2. Conhecimento confiável e Crenças duvidosas: algo a partir de nada
3. Conhecimento confiável e Crenças duvidosas: a) muito a partir de pouco; b) determinantes motivacionais e sociais
4. Lógica: dedução e indução
5. Falácias
6. Método científico
7. Ciência e pseudociência
8. Formas de aquisição de conhecimento e Comunicação científica
9. P1: primeira prova
10. Redação Projetos e Relatórios de Pesquisa
11. Representação gráfica de informação quantitativa
12. Estatística descritiva – medidas de tendência central
13. Estatística descritiva – medidas de dispersão
14. Estatística descritiva – exercícios
15. P2: segunda prova
16. SUB: prova substitutiva
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 94
Gráficos, uma visão ampla O que são gráficos? Quais são seus propósitos?
• Gráficos mostram medidas através do uso combinado
de pontos, linhas, um sistema de coordenadas,
números, palavras, cor e sombreamento.
• Como apresentar grandes quantidades de informação
de uma maneira compacta, precisa, adequada ao
propósito (público e situação) e de maneira
compreensível?
• Como explicitar as relações de causa e efeito,
salientando as comparações apropriadas sem criar
ilusões ou induzir ao erro?
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 95
O poder explicativo dos gráficos
• A mensagem é o importante, não a metodologia
ou o meio utilizado
• Mostre as relações de causa e efeito
• Informação clara e precisa
• Encoraje a compreensão
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 96
O poder explicativo dos gráficos
(dados com mesma média e variância)
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 97
Relevância
• Vivemos em uma época de rápida transformação e
aumento vertiginoso da informação e do
conhecimento.
100 M anos
100 k anos
300 anos
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 98
Este gráfico é um bom exemplo?
100 M anos
100 k anos
300 anos
Theodore Modis e Ray Kurzweil
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 99
Relevância
• Estamos cada vez mais imersos em informação gráfica,
em todas a áreas do conhecimento e da atividade
humana.
• O que veremos na aula de hoje aplica-se não somente à
visualização de informação estatística, mas também a
qualquer tipo de informação gráfica, mesmo que
envolva texto.
• Desenvolveremos uma abordagem consistente para
visualização de informação gráfica que facilitará a
divulgação, a acurácia e que seja de fácil compreensão.
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 100
O primeiro gráfico conhecido data do século 10, mais ou
menos à mesma época em que Guido de Arezzo desenvolveu
uma notação musical em duas dimensões, semelhante à que
usamos hoje.
O origem dos gráficos
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 101
• No século 15, Nicolas de Cusa desenvolveu gráficos da distância contra a velocidade.
• No século 17, Rene Descartes estabeleceu a geometria analítica, que era utilizada apenas para funções matemáticas.
• O grande referencial foi William Playfair (1759-1823) que desenvolveu os gráficos de linha, de barras e de pizza, muito utilizados hoje.
• O uso de gráficos, i.e., comprimento e área para representar quantidades e séries temporais, surgiu depois de outras conquistas matemáticas importantes, tais como logaritmos, coordenadas cartesianas, o cálculo e a teoria da probabilidade.
O origem dos gráficos
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 102
O cólera
• O médico John Snow
(1813-1858) interessado
no combate à epidemia de
cólera em Londres em
1854, compilou a seguinte
tabela, com 500 mortes.
• Alguém discerne algum
padrão?
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 103
Gráficos mostram medidas
• Pontos
• Linhas
• Números
• Palavras
• Sombreamento
• Cor
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 104
Eficácia
• Pontos
• Linhas
• Números
• Palavras
• Sombreamento
• Cor
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 105
Quantas páginas de tabelas são necessárias para colocar toda a
informação referente a esses 3056 distritos, representados
neste gráfico?
02/06/2014
Poliomelite
VIROLOGY:
Poliomyelitis Eradication--a Dangerous
EndgameNeal Nathanson and Paul Fine (12 April
2002)
Science 296 (5566), 269.
[DOI: 10.1126/science.1071207]
A digital object identifier (DOI) is a character string used to uniquely identify an
electronic document or other object. Metadata about the object is stored in
association with the DOI name and this metadata may include a location, such
as a URL, where the object can be found. The DOI for a document is
permanent, whereas its location and other metadata may change. Referring to
an online document by its DOI provides more stable linking than simply
referring to it by its URL, as if its URL changes, the publisher need only
update the metadata for the DOI to link to the new URL
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 106 02/06/2014
Map of where toursists flock
de Nathan Yau
VIROLOGY:
Poliomyelitis Eradication--a Dangerous
EndgameNeal Nathanson and Paul Fine (12 April
2002)
Science 296 (5566), 269.
[DOI: 10.1126/science.1071207]
A digital object identifier (DOI) is a character string used to uniquely identify an
electronic document or other object. Metadata about the object is stored in
association with the DOI name and this metadata may include a location, such
as a URL, where the object can be found. The DOI for a document is
permanent, whereas its location and other metadata may change. Referring to
an online document by its DOI provides more stable linking than simply
referring to it by its URL, as if its URL changes, the publisher need only
update the metadata for the DOI to link to the new URL
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 107 02/06/2014
02/06/2014 Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 108
Iraq and Afghanistan casualities, home and away http://edition.cnn.com/SPECIALS/war.casualties/index.html (em 29/5/2010)
02/06/2014 Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 109
Iraq and Afghanistan casualities, home and away http://edition.cnn.com/SPECIALS/war.casualties/index.html (em 29/5/2010)
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 110
Gráficos podem mostrar muita informação, de diferentes
perspectivas: causa e efeito, relações, paralelas …
Campanha de Napoleão na Rússia em 1812
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 111
Escala de trens de Paris a Lion
Gráficos podem mostrar muita informação, de diferentes
perspectivas: causa e efeito, relações, paralelas …
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 112
Bons gráficos devem permitir
a comparação, ser
multivariados, ter alta
densidade, revelar interações.
Neste gráfico, pode-se obter
os horários de partida e
chegadas, tempo parado, as
cidades do trajeto,
transferências e velocidades.
Gráficos podem mostrar muita informação, de diferentes
perspectivas: causa e efeito, relações, paralelas …
Escala de trens de Paris a Lion
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 113
Escala de trens de Paris a Lion
Gráficos podem mostrar muita informação, de diferentes
perspectivas: causa e efeito, relações, paralelas …
Nesta versão, utiliza-se uma
grade mais clara e os nomes das
cidades aparecem nos dois lados
do gráfico.
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 114
Além de “mentiras, malditas mentiras, e estatística”
os gráficos também podem enganar!
Comparação de períodos completos com períodos
menores, como neste caso do número de prêmios
Nobel em intervalos de 10 e 5 anos.
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 115
Formas NÃO recomendadas
Irrelevante ! Para que a perspectiva ?
Nomes dos países repetidos 3 vezes
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 116
Formas NÃO recomendadas
O perímetro da circunferência cresce linearmente com o raio.
A área de um círculo cresce com o quadrado do raio.
O volume da esfera cresce com o cubo do raio.
• Como a área cresce mais rápido do que a altura, o gráfico dá a impressão de que a diferença é muito maior do que realmente é.
• Espaçamento horizontal incorreto. Los Angeles Times, 5/8/1979, p.3
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 117
Confuso e fora de escala, induz ao erro
18 milhas por galão em 1978 (15 mm)
27.5 milhas por galão em 1985 (130 mm)
Aumento no consumo = 100 . (27.5 - 18)/18 = 53%
Aumento na barra = 100 . (130 - 15)/15 = 767 %
New York Times, 9/8/1978. p. D-2
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 118
Gráficos podem
esconder (pré) conceitos
• As palavras no topo,
acima e sobre são
freqüentemente
associadas a “superior”.
Turnabout map, by Jesse
Levine, San Jose,
California, 1982
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 119
Created by Matthew Campbell and Prof. Greg Plumb
of East Central University in Oklahoma.
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 120
02/06/2014
• http://cavern.com/cave-science/
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 121 02/06/2014
Nutritional facts redesigned
de Nathan Yau
• Nutrition facts labels are uniform across
products, but let's imagine for a second
that you could do whatever you want, just
as long they showed certain bits of
information. FFunction takes a stab
at redesigning the standard milk
carton under this premise. No cows, no
fields of green, and no dairies. Just
nutritional facts and full transparency on
what's going into your body.
• This wouldn't work with a mass market,
but hey, they've got my purchase. After
all, data does a body good.
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 122 02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 123
Cartography
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 124
Watch and Clock Design
02/06/2014
Aula 9 – Representação gráfica da informação Prof. Camilo Rodrigues Neto 125
Bibliografia
• MAGALHÃES, Marcos N. e LIMA, Antonio C. P. Noções de probabilidade e
estatística. São Paulo: Edusp, 2005, 391 p.
• BUSSAB, Wilton O. e MORETTIN, Pedro A. Estatística básica. São Paulo:
Ed. Saraiva, 2004, 526 p.
• GOULD, Stephen Jay. A mediana não é a mensagem. In: CASTRO, Ricardo.
SIMPLESMENTE, Disponível em: http://simplesmente.com/ Acesso em: 20
set. 2007.
• TUFTE, Edward R., The visual display of quantitative information,
Connecticut: Graphics Press, 2001, 196 p.
• DORIN, Alan. Information Design. In: Multimedia Programming in Java,
Disponível em: http://www.csse.monash.edu.au/~cema/courses/CSE5910/
lectureFiles/lecture3b.htm, Acesso em: 11 jan.2008.
• LUO, Yan. Information and Presentation Styles. In: User Interface Design and
Programming. Disponível em: http://www.evl.uic.edu/aej/422/week02.html,
Acesso em: 5 dez. 2007.
02/06/2014