TADI - medidas de tendencia central - 4...TADI - medidas de tendencia central - 4.1 Created Date...

45
Medidas de tendência central ACH0021 – Tratamento e Análise de Dados/Informações Prof. Regis Rossi A. Faria 1º sem. 2020 Créditos: parte do conteúdo baseado em slides dos profs. Ana Amélia Benedito Silva e Marcelo Lauretto

Transcript of TADI - medidas de tendencia central - 4...TADI - medidas de tendencia central - 4.1 Created Date...

  • Medidas de tendência central

    ACH0021 – Tratamento e Análise de Dados/InformaçõesProf. Regis Rossi A. Faria1º sem. 2020

    Créditos: parte do conteúdo baseado em slides dos profs. Ana Amélia Benedito Silva e Marcelo Lauretto

  • Etapas da análise estatística

  • ANÁLISE DESCRITIVA

    • tabelas• gráficos• medidas

    – média, mediana, moda– desvio-padrão, coeficiente de variação– percentis, quartis, decis

  • Medidas de Tendência Central

    • média• mediana• moda

  • Entrevistamos 15 pessoas com curso superior que informaram seus salários (milhares de R$/mês):

    Quanto ganha quem tem curso superior?

    0,4 2,5 3,0 3,0 3,0 3,2 3,2 3,5 5,0 5,0 5,0 5,5 6,0 7,4 11

    11 2,5 5,0 5,0 5,5 3,0 3,5 3,0 0,4 3,2 5,0 3,0 3,2 7,4 6,0

    colocando em ordem

  • 8 9 10 11

    Gráfico de pontos dos salários das 15 pessoas com curso superior (milhares de R$/mês):

    0,4 2,5 3,0 3,0 3,0 3,2 3,2 3,5 5,0 5,0 5,0 5,5 6,0 7,4 11

    0 1 2 3 4 5 6 7

    Como resumir esta informação?

  • MÉDIA= [(11+2,5+5+5+5,5+3+3,5+3+0,4+3,2+5+3+3,2+7,4+6)/15] MÉDIA = 66,7/15

    MÉDIA= R$ 4.450,00

    Média• Média aritmética: é a medida mais utilizada

    onde !" é o valor de cada observação, n é o tamanho da amostra, e #$ é a média calculada.

    #$ = ∑"'() !"*

    No nosso exemplo teremos:

  • 0 1 2 3 4 5 6 7 8 9 10 11

    A média representa o quanto cada um receberia se o total de salários fosse distribuído igualmente.

    média = R$4.450,00

  • 0 1 2 3 4 5 6 7 8 9 10 11

    O que aconteceria com a média se removêssemos o salário discrepante (outlier) da amostra de salários?

    outlier

    média = R$4.450,00

  • 0 1 2 3 4 5 6 7 8 9 10 11

    outlier

    R$4.450,00R$3980,00

  • 2000 10010

    Salário de 14 sujeitos

    Salário de 1 sujeito

    ATENÇÃO! A média é uma medida sensível a valores extremos!

    R$4.450,00

    R$17.050,00

    MÉDIA=(200+2,5+5+5+5,5+3+3,5+3+0,4+3,2+5+3+3,2+7,4+6)/15=255,7/15=17,05

    E o que aconteceria com a média se o salário mais alto da amostra fosse de 200 mil reais ao invés de 11 mil reais?

  • MEDIANA

    • divide uma distribuição ordenadade dados em 2 metades iguais

    • é um índice de posição

    alternativa para a média

  • MEDIANA

    Quando o n0 de elementos n é ímpar, obtém-se a mediana “pegando-se” o elemento central.

    Exemplo: 2 5 9 14 21

    Logo: MEDIANA = 9

  • MEDIANA

    • Quando o n0 de elementos n é par, obtém-se a mediana “pegando-se” os elementos centrais

    Exemplo: 2 5 9 14 21 28

    Logo: MEDIANA = (9+14)/2 = 11,5

  • 0,4 2,5 3 3 3 3,2 3,2 3,5 5 5 5 5,5 6 7,4 11

    0,4 2,5 3 3 3 3,2 3,2 3,5 5 5 5 5,5 6 7,4 200

    A troca de 11 por 200 mudou a média de 4,45 para 17,05

    A troca de 11 por 200 não mudou a mediana que se manteve em 3,5!!!

    voltando aos salários

    porém....

  • salários com 11mil

    salários com 200mil

    salários sem 11mil

    0.40 0.40 0.402.50 2.50 2.503.00 3.00 3.003.00 3.00 3.003.00 3.00 3.003.20 3.20 3.203.20 3.20 3.203.50 3.50 3.505.00 5.00 5.005.00 5.00 5.005.00 5.00 5.005.50 5.50 5.506.00 6.00 6.007.40 7.40 7.4011.00 200.00

    média 4.45 17.05 3.98

    mediana 3.50 3.50 3.35

    a média mudou

    a mediana não mudou

  • 0 10 20 30 40 50 60 70

    Md = 22,5 média = 24,7

    50% dos valores 50% dos valores

    MÉDIA E MEDIANA

  • 50%50%

    média = mediana

    (a) Distribuiçãosimétrica

    50%

    50%

    mediana média

    (b) Distribuiçãoassimétrica

    MÉDIA E MEDIANA

  • moda

  • • valor que ocorre com maior freqüência• obtida por inspeção da tabela de

    distribuição de freqüências• útil para medidas qualitativas

    Exemplo: candidatos numa eleiçãotimes de futebol

    Moda

  • Moda• Ex: no conjunto de escores 58, 82, 82, 90, 98, a

    moda é 82 porque ocorre duas vezes, enquanto os demais escores ocorrem apenas uma vez.

    • Útil para sumarizar variáveis qualitativas.– Ex: preferências de religiões (dados fictícios)

    Moda da distribuição: Protestante

  • ModaCandidatos a Prefeitura de SP: Marta (M), Doria (D), Haddad (H), Russomano (R)

    D D D D D H H H H H H H M D D D D M M R R R D D D

    candidato N %Doria 12 48

    Haddad 6 24Marta 4 16

    Russomano 3 12TOTAL 25 100

    MODA

  • ModaTIME FAVORITO Corinthians (C), Palmeiras (P), São Paulo (SP), Santos (S)

    C C C C C C P P P P SP SP P S S SP SP S C C

    candidato N %Corinthians 8 40Palmeiras 5 25São Paulo 4 20

    Santos 3 15TOTAL 20 100

    MODA

  • Limitações da moda• Algumas distribuições não possuem moda– Ex:

  • Limitações da moda

    • Algumas distribuições possuem tantas modas que a estatística deixa de ter significado. – Ex: distribuição de

    escores de testes. • Modas

    identificadas: 55,66,78,82,90,97. • Qual dessas

    representa um valor "típico"?

  • Limitações da moda• Em variáveis quantitativas

    ou qualitativas ordinais, a moda pode não ser central na distribuição como um todo.– Ex: distribuição de escores

    de testes. • Moda: 93• Esse valor é um bom

    representante da distribuição?

  • Exercícios

    Veremos agora exercícios para calcular a média, a mediana e a moda para 2 situações diferentes: (a) quando temos acesso às observaçõesda amostra; (b) quando temos acesso a tabelas de dados sobre a amostra

  • Exercício 1

    O número de dias que sete pacientes submetidos a um transplante renal sobreviveram, após cirurgia em determinado hospital, foi:

    17, 5, 48, 120, 651, 64, 150. • Apresente os dados em um gráfico de pontos.• Calcule a média, a mediana e a moda.

  • Cálculo da média: com acesso àsobservações

    • Este é o caso de uso da média aritmética simples• É dada pela divisão entre a soma dos escores observados (x1, x2,

    ... , xn) e o número total de observações (n):

    !" = ∑%&'( )%*

    • Este tipo de média é calculado quando os valores não estão tabulados, ou seja, quando os escores são conhecidos individualmente.

    • Ex: Suponha uma mostra de 10 crianças de 5 anos de idade, com dados referentes a seus pesos (em Kg): – 23.0, 20.0, 22.0, 19.0, 25.0, 28.2, 24.0, 21.0, 27.0, 21.0

    – !" = ∑+,-. /+( =

    012032002'4205206.020820'20920''3 ≅ 23.0

  • Cálculo da mediana: com acessoàs observações

    1. Ordene os escores em ordem crescente (ou decrescente)2. Se o número de elementos (n) for ímpar:

    – A mediana será o elemento localizado exatamente no centro.– O índice do elemento central é dado por (n+1) / 2.

    3. Se o número de elementos (n) for par:– A mediana será exatamente o valor central dos dois casos do

    meio da distribuição.– Os índices do primeiro e do segundo casos centrais são

    dados por n/2 e n/2 + 1.

    4. Por exemplo, se n=14, a mediana é o escore situado no centro dos escores do sétimo e oitavo casos.

  • Cálculo da mediana: com acessoàs observações

    • Neste caso abaixo temos acesso àsobservaçõesCálculo da mediana com sete casos (n ímpar)

    Cálculo da mediana com oito casos (n par)

  • Acompanhe solução do Exercício 1 em planilha

  • Exercício 2• Distribuição de

    freqüências do número de pessoas residentes no domicílio, numa amostra de 40 residências (Ref. Conjunto Residencial Monte Verde, Florianópolis – SC, 1988)

    • Calcule a média, a mediana e a moda do número de pessoas por domicílio.

    Número de pessoas por domicílio Frequência

    1 12 33 64 135 116 47 08 2

    Total 40

  • Cálculo da média: com acesso a tabelas de frequências dos dados

    • Quando temos acesso às frequências dos valores das observações, istoé, quando os dados estão agrupados em distribuições de frequência,usamos a media aritmética ponderada

    • Os valores x1, x2, ... , xn são ponderados pelas respectivas frequências absolutas f1, f2, ... , fn

    Pessoas/domicílioxi

    Frequênciafi

    1 12 33 64 135 116 47 08 2

    Total 40

    A média será:!" = ∑%&'

    ( )% *%+

    onde n é a soma das frequências: + = ∑,&'( ),

    No exemplo, fica:

    !" = ∑%&'( )% *%+

    = 1×1 + 3×2 + 6×3 +⋯ + 0×7 + 2×840 =17240

    = 4,3

  • Cálculo da mediana: com acesso a tabelas de frequências dos dados

    • Quando temos acesso às frequências dos valores das observaçõesa) Calcula-se inicialmente a posição do elemento original dos dados

    correspondente à mediana, isto é, qual observação é a medianab) Determinada a posição da mediana, localiza-se na tabela de

    frequências a linha que contém essa posição.

    Pessoas/domicílio Frequência Freq. acumulada1 1 12 3 43 6 104 13 235 11 346 4 387 0 388 2 40

    Total 40 40

    • Como n=40 é par, a mediana é a média dos elementos de ordem (40/2)= 20 e (40/2)+1= 21.

    • Analisando as frequências acumuladas na tabela ao lado, conclui-se que a mediana tem valor 4

    • Med = 4 pessoas/domicílio

  • Acompanhe solução do Exercício 2 em planilha

  • Cálculo da mediana para dados agrupados em classes

    • Neste caso temos acesso a faixas de valores das respostas e suas frequências

    • Determina-se a linha da tabela que contém a mediana na tabela de forma similar àquela mostrada no slide anterior (cálculo da mediana para dados organizados em tabelas de frequências)

    • Uma vez determinada a classe, deve-se calcular o valor da mediana por método de interpolação.

    • Ex: distribuição das notas obtidas por candidatos em um vestibular.

  • Cálculo da mediana para dados agrupados em classes

    • Após calcular a posição da mediana, localiza-se, a partir das frequências acumuladas na tabela, a classe na qual a mesma se encontra.

  • Cálculo da mediana para dados agrupados em classes

    • O valor da mediana é obtido aplicando-se a fórmula:

    !" = $% +'(%

    )2 − ,%-.

    onde:– ℎ = linha da tabela que contém a mediana; – $% = limite inferior da classe que contém a mediana;– a = amplitude do intervalo de classe;– (% = frequência da classe que contém a mediana;– ) = quantidade total de elementos;– ,%-. = Frequência acumulada até a classe anterior à classe

    que contém a mediana.

  • Cálculo da mediana para dados agrupados em classes

  • Acompanhe cálculo da mediana por interpolação(onde se tem acesso aosintervalos de valores das

    classes dos dados)

  • Exercício 3 (trabalho)Os dados abaixo referem-se ao número de dias de permanência de pacientes em um hospital. Pede-se: 1. Calcule a média, a mediana e a moda do tempo de internação destes

    pacientes.2. Construa uma tabela de distribuição de frequências usando intervalos de 2

    dias.3. Recalcule a média, a mediana e a moda a partir da tabela acima.4. Justifique as diferenças encontradas.

    7 8 1 7 13 612 12 3 17 4 24 15 2 14 3 510 8 9 8 5 32 7 14 12 10 81 6 4 7 7 11

  • Exercício 4 (em classe)• Você está procurando emprego para o próximo ano. As

    empresas A e B são totalmente equivalentes a menos de suaspolíticas de remuneração. As características de remuneração de cada uma são resumidas na tabela a seguir:

    • Qual das duas empresas você escolheria? Justifique.

    Empresa A BMédia 2500 2000Mediana 1700 1900Moda 1500 1900

  • Exercício 4 (resposta)• Resposta: Depende de sua qualificação.

    – A empresa A tem metade dos funcionários ganhando até1700, sendo o valor mais comum 1500. Como a média é2500, há alguns poucos funcionários ganhando muito.

    – A empresa B tem as três medidas muito próximas a 1900, indicando uma política salarial mais homogênea.

    • Se você é altamente qualificado, as chances são de ganhar maisna empresa A. Se você tem qualificação igual ou inferior à média, a melhor escolha é a empresa B.

    Empresa A B

    Média 2500 2000

    Mediana 1700 1900

    Moda 1500 1900

  • Fim