Formulario analise de dados

12
1 Tendência Central MÉDIA X= xi .¿ n ¿ Valor que equilibra a distribuição, dado que a soma dos desvios em relação à média é = 0 Influenciada por valores extremos. Indicada para distribuições simétricas. Propriedades: Soma/subtracção de K a todas as variáveis: somar/subtrair K à média Multiplicação/divisão de K a todas as variáveis: multiplicar/dividir a média por k Obtém-se o valor da média Adição/subtracção e Multiplicação/divisão –> altera média MEDIANA n -> par ~ x= x k +x k +1 2 n -> ímpar ~ x= x k +1 Valor que ocupa a posição central na sucessão das observações. Valor que divide o conjunto dos dados ordenados em 2 subconjuntos, cada um com cerca de metade das observações. Insensível a valores extremos. Indicada para distribuições assimétricas. Propriedades: Soma/subtracção de K a todas as variáveis: somar/subtrair K à média Multiplicação/divisão de K a todas as variáveis: multiplicar/dividir a média por k Obtém-se o nº da observação que representa a mediana Moda Mo = valor que ocorre mais vezes na distribuição A moda pode não ser única. Com 2 ou mais modas chamam-se distribuições PLURIMODAIS Propriedades: Soma/subtracção de K a todas as variáveis: somar/subtrair K à média Multiplicação/divisão de K a todas as variáveis: multiplicar/dividir a média por Valor da variável com maior frequência

Transcript of Formulario analise de dados

8

Tendncia CentralMDIA

Valor que equilibra a distribuio, dado que a soma dos desvios em relao mdia = 0Influenciada por valores extremos. Indicada para distribuies simtricas.Propriedades:Soma/subtraco de K a todas as variveis: somar/subtrair K mdia Multiplicao/diviso de K a todas as variveis: multiplicar/dividir a mdia por k

Obtm-se o valor da mdiaAdio/subtraco e Multiplicao/diviso > altera mdia

MEDIANAn -> par

n -> mpar

Valor que ocupa a posio central na sucesso das observaes. Valor que divide o conjunto dos dados ordenados em 2 subconjuntos, cada um com cerca de metade das observaes.Insensvel a valores extremos. Indicada para distribuies assimtricas.Propriedades:Soma/subtraco de K a todas as variveis: somar/subtrair K mdia Multiplicao/diviso de K a todas as variveis: multiplicar/dividir a mdia por kObtm-se o n da observao que representa a mediana

Moda

Mo = valor que ocorre mais vezes na distribuioA moda pode no ser nica. Com 2 ou mais modas chamam-se distribuies PLURIMODAISPropriedades:Soma/subtraco de K a todas as variveis: somar/subtrair K mdia Multiplicao/diviso de K a todas as variveis: multiplicar/dividir a mdia por k

Valor da varivel com maior frequncia

Em distribuies simtricas mdia, mediana e moda so muito prximas

Tendncia No-CentralQUANTIS (elementos de separao)

Quartis

Decis

Centis (Percentis)

Valores que dividem a distribuio em partes iguaisPropriedades:Soma/subtraco de K a todas as variveis: somar/subtrair K mdia Multiplicao/diviso de K a todas as variveis: multiplicar/dividir a mdia por k

Obtm-se o n da observao

Resultado inteiroAdicionar 1 observao obtida

Resultado no inteiro a mdia das observaes obtidas(ex. 112,5, calcula-se a mdia do valor das obs 112 e 113)

MEDIDAS DE DISPERSOPermitem verificar a distncia entre as observaes e a representatividade dos valores mdiosAmplitude total

Mede a distncia entre 2 valores extremos

Sensvel a valores extremosObtm-se o valor referente diferena entre os observados como mximo e mnimo

Intervalo interquartil

Mede a disperso das observaes em relao mediana

Insensvel a valores extremos.Obtm-se o valor da disperso

Desvios

Clculo do desvio de cada observao em relao mdia.

A soma de todos os desvios sempre zero observao acima da mdia

No h desvio

Observao abaixo da mdia

Varincia

Ou

Mdia dos quadrados dos desvios em relao mdia.Propriedades:Soma/subtraco de K a todas as variveis: varincia no alteraMultiplicao/diviso de K a todas as variveis: multiplicar a varincia por k2

Traduz-se no quadrado das unidades em que est definida a varivel.

Quanto maior forem os quadrados maiores so os desvios.

Desvio padro

Mdia dos quadrados dos desvios em relao mdiaPropriedades:Soma/subtraco de K a todas as variveis: varincia no alteraMultiplicao/diviso de K a todas as variveis: multiplicar/dividir o desvio por k

Raiz quadrada da varincia, usa-se porque tem a vantagem de estar expressa na mesma unidade da varivel

Coeficiente de variao (disperso relativa)

Permite a comparao entre duas ou mais distribuies, dado que independente da unidade em que se exprime a varivelValor em percentagem.Quanto maior a %, maior a disperso

o valor do desvio padro de x% da mdia

Variveis estandardizadas (variveis reduzidas)

Para cada valor da distribuio subtrai-se a mdia e divide-se pelo desvio padro. Indica quantas unidades est acima ou abaixo da mdia. Permite comparar o valor de cada caso com a distribuio (mdia = 0 e desvio padro = 1)

MEDIDAS DE DISPERSOPermitem verificar a distncia entre as observaes e a representatividade dos valores mdiosOutlier

Valor muito grande ou muito pequeno em relao s outras observaesObtm-se o valor extremo

Caixa de Bigodes

Diagrama no qual esto representados os valores mximo e mnimos, os outliers e o intervalo interquartis

Diagrama de caule e folhas

Caule Folhas Frequncia0 334 30* 7889999 71 0001123 71* 44555 5

Estrutura os dados de forma a obter uma rpida informao. Os dgitos de cada nmero so divididos em dgitos principais (caules) e dgitos secundrios (folhas)

Medidas de assimetria (Indica o enviesamento das observaes) SIMTRICA ASSIMTRICA POSITIVA ASSIMTRICA NEGATIVA enviesada esquerda-enviesada direita predominam os desvios positivos predominam os desvios negativos ou ou ouQ3 Q2 = Q2 Q1 Q3 Q2 > Q2 Q1 Q3 Q2 < Q2 Q1

(Medidas de assimetria)Coeficiente de Pearson

Sensvel a valores extremosCoeficiente de Bowley

Pouco Sensvel a valores extremosResultados:

g > 0 = assimetria positivag < 0 = assimetria negativag = 0 = simetria

ANLISE BIVARIADA DE DADOSANLISE DE CORRELAO associao entre varveis (sentido e intensidade)Avaliao grfica - DIAGRAMA DE DISPERSORepresentao dos vrios pares ordenados (x,y) num referencial cartesiano, permitindo visualizar a relao existente entre eles

ASSOCIAO POSITIVA ASSOCIAO NEGATIVA ASSOCIAO NULA (X aumenta; Y aumenta) (X aumenta; Y diminui) (no h qualquer tipo de relao)

A relao (associao) existente entre as variveis pode ser caracterizada quanto a:

FORMALinear pontos tm tendncia para aproximar de uma rectaNo linear pontos tm tendncia para aproximar de uma curvaSENTIDOPositiva ou directa variveis evoluem no mesmo sentido

Negativa ou inversa variveis evoluem em sentido contrrio INTENSIDADEPode ser nula, imperfeita (fraca ou forte), perfeita

Avaliao analtica COVARINCIA

Medida do grau de associao linear (mdia dos produtos dos desvios em relao mdia)

A covarincia sensvel mudana de escala, por este motivo no uma medida adequada para avaliar a intensidade da relao linearcov = 0 (nula) no existe relao linear entre as variveiscov < 0 (negativa) quando uma varivel aumenta a outra diminuicov > 0 (positiva) quando uma varivel aumenta a outra tambm aumenta

Avaliao analtica CORRELAO

* Serve para obviar os inconvenientes da covarincia* O Coeficiente de Correlao (Pearson) mede a intensidade da associao entre as variveis, uma normalizao da covarincia, dividindo-a pelo produtos dos desvios padro* Insensvel escala de medio e de origem* No mede a dependncia funcional, nunca constitui uma prova slida de relaes causais.* permite comparar variveis expressas em unidades diferentes

Intervalo da variao

r =-1 = correlao perfeita negativar < 0 => correlao no perfeita negativar = 0 = correlao nular > 0 => correlao no perfeita positivar = 1 = correlao perfeita positivaem valor absoluto, quanto maior for o coeficiente, maior ser a associao

ANLISE BIVARIADA DE DADOSANLISE DE REGRESSO (linear simples) estuda a relao funcional entre as variveis

Modelo de regresso linearMtodo dos mnimos quadrados (recta de regresso = valor real observado

= recta ajustada

Clculo de b:

Clculo de a, obtm-se pela equao:

Pretende-se ajustar uma recta que minimize o somatrio do quadrado dos resduos

Y = varivel dependente ou endgenaX = varivel independente ou exgenea

e = varivel residual ou erroa = constante, intercepo da recta com o eixo verticalb = constante, declive da recta

Medida da qualidade do ajustamento

O objectivo com que se ajustam as rectas de regresso dos mnimos quadrados e, em geral, o de prever ou predizer o valor de uma das variveis uma vez conhecido o valor da outra. Mas a previso pode ser pior ou melhor. A questo que se pes a de avaliar a qualidade do ajustamento.

o valor do r2 deve ler-se x% da variao do Y explicada pela variao do XIntervalo de variao:

= ausncia de relao linearAs rectas confundem-se, esto sobrepostas ou = implica relao linear perfeita. As rectas confundem-se, esto sobrepostas

Quando existe correlao linear no perfeita, quanto maior o coeficiente de correlao, menor o ngulo formado pelas duas rectas de regresso.