24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

48
An An An An An An An An á á á á á á lise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de Dados Dados Dados Dados Dados Dados Dados Dados Tabelas e Gráficos Parte II: Organizando e apresentando os dados de variáveis quantitativas 0 10 20 30 40 50 60 70 80 90 100 Sim Não Sindicalização % 20 30 40 50 0 10 20 IdadeMotorista Porcentagem

description

estatística

Transcript of 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Page 1: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

AnAnAnAnAnAnAnAnáááááááálise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de DadosDadosDadosDadosDadosDadosDadosDados

Tabelas e Gráficos

Parte II: Organizando e apresentandoos dados de variáveis quantitativas

0

10

20

30

40

50

60

70

80

90

100

Sim Não

Sindicalização

%

20 30 40 50

0

10

20

IdadeMotorista

Por

cent

agem

Page 2: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Relembrando: Planilha de Dados

Page 3: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Variáveis Discretas

Distribuição de Frequências

Page 4: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Variáveis discretas que assumempoucos valores distintos

[ Ellison, 2004 ]

Page 5: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

0 1 2 3 4 5

Número de espécies

Fre

quên

cia

Rel

ativ

a (%

)

010

2030

40

Florestas

Page 6: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Variáveis discretas que assumempoucos valores distintos

[ Ellison, 2004 ]

Page 7: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Pântanos

0 1 2 3 4 5

Número de espécies

Fre

quên

cia

Rel

ativ

a (%

)

010

2030

40

Page 8: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

0 1 2 3 4 5

Número de espécies

Fre

quên

cia

Rel

ativ

a (%

)

010

2030

40

0 1 2 3 4 5

Número de espécies

Fre

quên

cia

Rel

ativ

a (%

)

010

2030

40

Comparando os dois tipos de habitats

Page 9: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Variável discreta que assume um grandenúmero de valores distintos

[Reis e Reis, 2001]

Solução: agrupar valores em classes

Page 10: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas
Page 11: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas
Page 12: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Variáveis Contínuas

Estudando a

Distribuição de Frequências

Page 13: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Variáveis contínuas assumem muitos valoresdistintos

Solução: agrupar valores em classes

Page 14: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Area das folhas, cm2

Fre

quen

cia

Abs

olut

a

5 10 15 20

020

040

060

080

0

Histograma de frequências

Gráfico para a distribuição de frequências de variáveis contínuas

10

.06

44

.89

32

.64

10

.27

1.8

2

0.2

1

0.0

5

0.0

5

Page 15: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Histograma de densidade

Den

sida

de

5 10 15 20

0.00

0.05

0.10

0.15

0.20

Área da barra = frequência relativa da classe

2 x 0.0514 = 0.1027

Soma das áreas de todas as barras = 100%

frequência relativa da classe

tamanho da classeDensidade =

Page 16: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Vantagem do histograma de densidadeD

ensi

dade

5 10 15 20

0.00

0.05

0.10

0.15

0.20 Cálculo da frequência em classes

diferentes daquelas apresentadas no histograma.

Exemplo: qual é a frequência de plantas com área foliar entre 7.0 e 11.0 cm2?

( 1 x 0.2244 ) +

( 2 x 0.1632 ) +

( 1 x 0.0513 ) = 0.6022

Page 17: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Simétrica

50 60 70 80 90 100 110 120 130 140 150

0

1

2

3

4

5

6

Variável

Fre

quên

cia

rela

tiva

(%)

Classificação da Distribuição de Frequências de uma

Variável Contínua quanto a sua Forma

0 10 20 30

0

1

2

3

4

5

6

7

8

9

10

Variável

Fre

quên

cia

rela

tiva

(%)

Assimétrica

92 93 94 95 96 97 98 99 100 101 102

0

1

2

3

4

5

6

Variável

Fre

quên

cia

rela

tiva

(%)

Com concentração à

esquerda

Com concentração à

direita

Page 18: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

5 10 15 20

020

4060

8010

0

Área das folhas, cm2

Fre

quen

cia

Rel

ativ

a A

cum

ulad

a

Ogiva: gráfico das frequências acumuladas

Page 19: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

O eixo horizontal utiliza os limites superiores das classes

Page 20: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Uma ogivasempre termina

em 100%

5 10 15 20

020

4060

8010

0

Área das folhas, cm2

Fre

quen

cia

Rel

ativ

a A

cum

ulad

a

Uma ogivasempre começa

em 0%

Page 21: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

5 10 15 20

020

4060

8010

0

Área das folhas, cm2

Fre

quen

cia

Rel

ativ

a A

cum

ulad

a

Qual é o percentual de plantas quepossuem área foliar abaixo de 11 cm2?

92

11

Page 22: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

5 10 15 20

020

4060

8010

0

Área das folhas, cm2

Fre

quen

cia

Rel

ativ

a A

cum

ulad

a

Qual é o valor de área foliar que deixa 50% das plantas abaixo dele?

50

8

Page 23: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Assimétrica(concentração à

direita)ou (cauda à esquerda)

Simétrica

Assimétrica (concentração àesquerda) ou (cauda à direita)

Formas básicas para a distribuição de frequências de uma variável contínua

Page 24: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Comparando duas distribuições de frequências

5 10 15 20

020

4060

8010

0

Área das folhas, cm2

Fre

quen

cia

Rel

ativ

a A

cum

ulad

a

5 10 15 20

020

4060

8010

0

Variedade 1Variedade 2Variedade 1Variedade 2

A distribuição da área foliar das plantas da variedade 2 émais assimétrica

concentrada à esquerda

do que a distribuição da área foliar das plantas da variedade 1.

Page 25: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Visualizando pequenos conjuntos de dados

Diagrama de Pontos

Diagrama de Ramo-e-folhas

Page 26: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Diagrama de Pontos

[Reis e Reis, 2001]

Page 27: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Diagrama de Ramo-e-Folhas

4 4 5 6 6 6 6 6 7 7 7 8 9 9 10 10 12 14 15 16 17 18

Número de espécies de formigas em 22 pontos de coleta em habitats de floresta (valores ordenados)

4 4 5 6 6 6 6 6 7 7 7 8 9 910 10 12 14 15 16 17 18

Separando os dados pelas dezenas, uma em cada linha

Page 28: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Diagrama de Ramo-e-Folhas

4 4 5 6 6 6 6 6 7 7 7 8 9 9

10 10 12 14 15 16 17 18

Separando as unidades de cada dezena em dois grupos: de 0 a 4 e de 5 a 9

0| 4 4 0| 5 6 6 6 6 6 7 7 7 8 9 91| 0 0 2 4 1| 5 6 7 8

Colocando as dezenas em “evidência”

ramosfolhas

Page 29: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Diagrama de Ramo-e-Folhas

Page 30: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Ramo-e-Folhas duplo

Page 31: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Estudando uma variávelao longo do tempo

Gráfico de linha(Séries Temporais)

Page 32: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Séries temporais (ou séries históricas) são um conjunto de observações de uma mesma variável quantitativa (discreta ou contínua) feitas ao longo do tempo.

Os gráficos mais comuns para a representação de uma série temporal são os

gráficos de linha.

22252023282524221415Ovos

10987654321Semana

Número de ovos de Aedes Aegypti emovitrampas ao longo de 10 semanas

Page 33: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Sem

ana

Número de ovos por armadilha

24

68

10

15 20 25 30

Page 34: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Sem

ana

Número de ovos por armadilha

24

68

10

0 10 20 30 40

24

68

10

0 10 20 30 40

24

68

10

0 10 20 30 40

Área 1

Área 2

Área 3

Page 35: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

1900 1920 1940 1960 1980

-6-4

-20

24

Ano

Altu

ra e

m r

elaç

ão a

um

pon

to a

rbitr

ário

Nível de água do Rio Negro

(médias mensais das observações diárias, em metros)

Page 36: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Gráfico de linhas para o preço médio do litro de leite “Folha de São Paulo” (set/2001)

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

Maio Junho Julho Agosto

Cuidados ao elaborar um gráfico de linhas : a escala do gráfico

[Reis e Reis, 2001]

Page 37: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

0,10

0,15

0,20

0,25

0,30

0,35

0,40

Maio Junho Julho Agosto

0,20

0,25

0,30

0,35

0,40

Maio Junho Julho A gos to0,24

0,26

0,28

0,30

0,32

0,34

0,36

Maio Junho Julho A gos to

Efeitos da mudança no início e/ou final da escala do gráfico de linhas da série temporal

do preço do leite.

[Reis e Reis, 2001]

Page 38: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,55

0,60

Maio Junho Julho Agosto

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,55

0,60

0,00

0,05

0,10

0,15

0,20

0,25

0,30

0,35

0,40

0,45

0,50

0,55

0,60

Maio Junho Julho Agosto

Efeitos de alterações na dimensão horizontal do gráfico de linhas da série do preço do leite

Page 39: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Alguns cuidados

• O início do eixo vertical seja o valor mínimo possível para a variável que estásendo representada (para o caso do preço de leite, o valor zero, leite de graça)

• O final do eixo vertical seja tal que a série fica centrada em relação ao eixo vertical

• Os tamanhos dos eixos sejam o mais parecidos possível .

0,10

0,15

0,20

0,25

0,30

0,35

0,40

Maio Junho Julho Agosto

Page 40: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Praticando Estatística

Como fazer

histogramas, ogivas, ramo-e-folhas e

gráficos de linhas

usando o ?

Page 41: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Como fazer usando o R ?

Gráfico de Barras para Dados de Variáveis Discretas

Quando não se conhece as frequências das classes

(dados brutos)

ants <- read.table("ants.txt",header=T)

tabela <- table(ants$Srich[ants$Habitat=="Forest"])

barplot(tabela, ylab="Frequência Absoluta",

main="Riqueza de Espécies de Formigas",

xlab="Número de espécies de formigas",

col="darkred")

Page 42: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Como fazer usando o R ?

Gráfico de Barras para Dados de Variáveis Discretas

Quando já se conhece as frequências das classes

Classes <- c(1, 2, 3, 4, 5, 6) # Classes

Formigas.pantano <- c(4.0,16.0,40.0,24.0,8.0,8.0)

# Frequências Relativas das classes

names(Formigas.pantano) <- Classes #Nomes das classes

barplot(Formigas.pantano, ylab="Frequência Relativa(%)",

main="Riqueza de Espécies de Formigas",

xlab="Número de espécies de formigas",

col="darkblue")

Page 43: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Como fazer usando o R ?

Histograma de Frequências

hist(ciclame$Area,breaks=seq(4,20,by=2),

xlim=c(4,20), xlab="Area das folhas, cm2",

ylab="Frequencia Absoluta", main="",

col="lightgreen")

Histograma de Densidade

hist(ciclame$Area,breaks=seq(4,20,by=2),

xlim=c(4,20), xlab="Area das folhas, cm2",

ylab="Frequencia Absoluta", main="",

col="purple", freq=F)

Page 44: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Como fazer usando o R ?Ogiva

classes<-hist(ciclame$Area,

breaks=seq(4,20,by=2))[[1]]

frequencias<-hist(ciclame$Area,

breaks=seq(4,20,by=2))[[2]]

freq.cum<- round(cumsum(frequencias)/

sum(frequencias),4)*100

plot(classes,c(0,freq.cum),type="l",lwd=2,

xlim=c(4,20), xlab="Área das folhas, cm2",

ylab="Frequencia Relativa Acumulada",

main="",col="red")

Con

stru

indo

as c

lass

es e

fr

equê

ncia

s ac

umul

adas

Des

enha

ndo

a og

iva

Page 45: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Como fazer usando o R ?

Ramo-e-folhas

# Riqueza de Especies em Habitats de Floresta

stem(ants$Srich[ants$Habitat=="Forest"])

# Riqueza de Especies em Habitats de Floresta

stem(ants$Srich[ants$Habitat=="Bog"])

Page 46: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Como fazer usando o R ?

Gráficos de Linhas

rionegro<-read.table("rionegro.txt",header=T)

# Lendo a série temporal mensal de alturas (“height”)

plot(rionegro$Year,rionegro$Height,type="b",

xlab="Ano",

ylab="Altura em relação a um ponto arbitrário")

abline(h=0) # Linha horizontal na altura zero

Page 47: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Fim da terceira aula

Próxima Aula

Análise Descritiva de Dados: Organizando e apresentando Dados de

Variáveis Quantitativas

Análise Descritiva de Dados: Resumindo os Dados de Variáveis

Quantitativas

Page 48: 24-08 - Aula 3 -Tabelas e Gráficos_Variaveis Quantitativas

Referências Bibliográficas

REIS, E.A.; REIS, I.A. (2001) Análise Descritiva de Dados- Tabelas e Gráficos, Relatório Técnico do Departamento de Estatística da UFMG. Disponível em: http://www.est.ufmg.br

ELLISON, A. E (2004). Bayesian inference in ecology. Ecology Letters, 7, 509–520.