Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf ·...
Transcript of Uma Variável Quantitativa: Forma e Centromrubens/cursos/EstatAplicCom/Capitulo2-2.pdf ·...
Estatística: Revelando o poder dos dados Lock5
Seção 2.2
Uma Variável Quantitativa:
Forma e Centro
Estatística: Revelando o poder dos dados Lock5
Sumário
Uma Variável Quantitativa
Visualização: gráfico de pontos e histograma
Forma: simétrica, assimétrica
Medidas do centro: média e mediana
Outliers e robustez
Estatística: Revelando o poder dos dados Lock5
Uma Variável Quantitativa
Receitas Mundiais dos Filmes de Hollywood em 2011
FilmesHollywood2011
Mais gráficos sobre lucrosdos filmes de Hollywood
Estatística: Revelando o poder dos dados Lock5
FilmesHollywood2011.xls
Estatística: Revelando o poder dos dados Lock5
Gráfico de Pontos
Em um gráfico de pontos, cada caso é representado por um ponto e os pontos são empilhados.
Maneira fácil de ver cada caso
attach(Filmes)Dotplot(ReceitaMundial, bin=TRUE, breaks=50)
Estatística: Revelando o poder dos dados Lock5
Histograma
A altura de cada barra corresponde ao número de casos dentro desse intervalo da variável
Estatística: Revelando o poder dos dados Lock5
Histograma vs Gráfico de Barras Um gráfico de barras é para dados categóricos e o eixo
x não possui escala numérica
Um histograma é para dados quantitativos e o eixo x é
numérico
Para uma variável categórica, o número de barras é
igual ao número de categorias e o número em cada
categoria é fixo
Para uma variável quantitativa, o número de barras em
um histograma depende de você (ou de seu software), e a
aparência pode diferir com diferentes números de barras
Estatística: Revelando o poder dos dados Lock5
Forma
Simétrica Assimatria à esquerdaAssimetria à direita
Cauda longa à direita
Estatística: Revelando o poder dos dados Lock5
Forma de Sino (simétrica)F
requency
-15 -10 -5 0 5 10 15
050
150
Fre
quency
-15 -10 -5 0 5 10 15
050
150
Estatística: Revelando o poder dos dados Lock5
Notação O tamanho da amostra, o número de casos na amostra, é denotado por n
Geralmente assumimos que x ou y representamqualquer variável, e x1 , x2 , …, xn representam os n valoresda variável x (no exemplo abaixo x representa ReceitaMundial)
x1 = 97,009, x2 = 201,897, …, x134 = NA, x135 = 30,147 , x136 = NA
Estatística: Revelando o poder dos dados Lock5
Média
A média ou média dos valores de dados é
𝑚é𝑑𝑖𝑎 =𝑠𝑜𝑚𝑎 𝑑𝑒 𝑡𝑜𝑑𝑜𝑠 𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑑𝑎𝑑𝑜𝑠
𝑄𝑢𝑎𝑛𝑡𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑑𝑎𝑑𝑜𝑠
Média amostral: ҧ𝑥 (lê-se “x barra”) Média populacional: (letra grega “mi”)
𝑚é𝑑𝑖𝑎 =𝑥1 + 𝑥2 +⋯+ 𝑥𝑛
𝑛=σ𝑥
𝑛
R: mean(x)
Estatística: Revelando o poder dos dados Lock5
Mediana
A mediana, m, é o valor do meio quando os dados estão ordenados.
Se houver um número par de valores, a mediana é a média dos dois valores
intermediários.
A mediana divide os dados ao meio.
Estatística: Revelando o poder dos dados Lock5
Medidas do Centro
Para cada uma das seguintes variáveis: Encontre a média Encontre a mediana Identifique quaisquer outliers
1. 8, 12, 3, 18, 15
2. 41, 53, 38, 12, 115, 47, 50
3. 15, 22, 12, 28, 58, 18, 25, 18
4. 110, 112, 118, 119, 122, 125, 129, 135, 138, 140
Estatística: Revelando o poder dos dados Lock5
m = 76,66
=150,74A média é "puxada" na direção da assimetria
Medidas do Centro
Estatística: Revelando o poder dos dados Lock5
Assimetria e Centro
Uma distribuição é assimétrica à esquerda. Qual medida do centro você esperaria ser maior?
Mediana. Neste caso a média será puxada para baixo em direção à assimetria (em direção à cauda mais longa).
Estatística: Revelando o poder dos dados Lock5
Assimetria e Centro
Média e mediana para diferentes formas de distribuição
Estatística: Revelando o poder dos dados Lock5
Outlier
Um outlier é um valor observado que é notavelmente distinto dos outros valores em um conjunto de dados.
Estatística: Revelando o poder dos dados Lock5
Outliers
Harry Potter
TransformersPirates of the Caribbean
Estatística: Revelando o poder dos dados Lock5
Robustez (traduzida como resistência)
Uma estatística é robusta se ela não for relativamente afetada por valores
extremos.
A mediana é robusta, enquanto a média não é.
Média Mediana
Com Harry Potter $150.742.300 $76.658.500
Sem Harry Potter $141.889.900 $75.009.000
Estatística: Revelando o poder dos dados Lock5
Outliers
Ao usar estatísticas que não são resistentes a valores discrepantes, pare e pense se o outlier é um erro
Se não, você tem que decidir se o outlier é parte de sua população de interesse ou não
Geralmente, para outliers que não são um erro, é melhor executar a análise duas vezes, uma vez com os outliers e uma vez sem, para ver o quanto os outliers estão afetando os resultados
Estatística: Revelando o poder dos dados Lock5
Resumo
Visualizando uma variável quantitativa:Gráfico de pontosHistograma
Forma: SimétricaAssimétrica
Medidas do centro:Média (resistente a outliers)Mediana (resistente a outliers)