Formulario analise de dados
-
Upload
margaridacosta -
Category
Documents
-
view
7 -
download
0
Transcript of Formulario analise de dados
8
Tendncia CentralMDIA
Valor que equilibra a distribuio, dado que a soma dos desvios em relao mdia = 0Influenciada por valores extremos. Indicada para distribuies simtricas.Propriedades:Soma/subtraco de K a todas as variveis: somar/subtrair K mdia Multiplicao/diviso de K a todas as variveis: multiplicar/dividir a mdia por k
Obtm-se o valor da mdiaAdio/subtraco e Multiplicao/diviso > altera mdia
MEDIANAn -> par
n -> mpar
Valor que ocupa a posio central na sucesso das observaes. Valor que divide o conjunto dos dados ordenados em 2 subconjuntos, cada um com cerca de metade das observaes.Insensvel a valores extremos. Indicada para distribuies assimtricas.Propriedades:Soma/subtraco de K a todas as variveis: somar/subtrair K mdia Multiplicao/diviso de K a todas as variveis: multiplicar/dividir a mdia por kObtm-se o n da observao que representa a mediana
Moda
Mo = valor que ocorre mais vezes na distribuioA moda pode no ser nica. Com 2 ou mais modas chamam-se distribuies PLURIMODAISPropriedades:Soma/subtraco de K a todas as variveis: somar/subtrair K mdia Multiplicao/diviso de K a todas as variveis: multiplicar/dividir a mdia por k
Valor da varivel com maior frequncia
Em distribuies simtricas mdia, mediana e moda so muito prximas
Tendncia No-CentralQUANTIS (elementos de separao)
Quartis
Decis
Centis (Percentis)
Valores que dividem a distribuio em partes iguaisPropriedades:Soma/subtraco de K a todas as variveis: somar/subtrair K mdia Multiplicao/diviso de K a todas as variveis: multiplicar/dividir a mdia por k
Obtm-se o n da observao
Resultado inteiroAdicionar 1 observao obtida
Resultado no inteiro a mdia das observaes obtidas(ex. 112,5, calcula-se a mdia do valor das obs 112 e 113)
MEDIDAS DE DISPERSOPermitem verificar a distncia entre as observaes e a representatividade dos valores mdiosAmplitude total
Mede a distncia entre 2 valores extremos
Sensvel a valores extremosObtm-se o valor referente diferena entre os observados como mximo e mnimo
Intervalo interquartil
Mede a disperso das observaes em relao mediana
Insensvel a valores extremos.Obtm-se o valor da disperso
Desvios
Clculo do desvio de cada observao em relao mdia.
A soma de todos os desvios sempre zero observao acima da mdia
No h desvio
Observao abaixo da mdia
Varincia
Ou
Mdia dos quadrados dos desvios em relao mdia.Propriedades:Soma/subtraco de K a todas as variveis: varincia no alteraMultiplicao/diviso de K a todas as variveis: multiplicar a varincia por k2
Traduz-se no quadrado das unidades em que est definida a varivel.
Quanto maior forem os quadrados maiores so os desvios.
Desvio padro
Mdia dos quadrados dos desvios em relao mdiaPropriedades:Soma/subtraco de K a todas as variveis: varincia no alteraMultiplicao/diviso de K a todas as variveis: multiplicar/dividir o desvio por k
Raiz quadrada da varincia, usa-se porque tem a vantagem de estar expressa na mesma unidade da varivel
Coeficiente de variao (disperso relativa)
Permite a comparao entre duas ou mais distribuies, dado que independente da unidade em que se exprime a varivelValor em percentagem.Quanto maior a %, maior a disperso
o valor do desvio padro de x% da mdia
Variveis estandardizadas (variveis reduzidas)
Para cada valor da distribuio subtrai-se a mdia e divide-se pelo desvio padro. Indica quantas unidades est acima ou abaixo da mdia. Permite comparar o valor de cada caso com a distribuio (mdia = 0 e desvio padro = 1)
MEDIDAS DE DISPERSOPermitem verificar a distncia entre as observaes e a representatividade dos valores mdiosOutlier
Valor muito grande ou muito pequeno em relao s outras observaesObtm-se o valor extremo
Caixa de Bigodes
Diagrama no qual esto representados os valores mximo e mnimos, os outliers e o intervalo interquartis
Diagrama de caule e folhas
Caule Folhas Frequncia0 334 30* 7889999 71 0001123 71* 44555 5
Estrutura os dados de forma a obter uma rpida informao. Os dgitos de cada nmero so divididos em dgitos principais (caules) e dgitos secundrios (folhas)
Medidas de assimetria (Indica o enviesamento das observaes) SIMTRICA ASSIMTRICA POSITIVA ASSIMTRICA NEGATIVA enviesada esquerda-enviesada direita predominam os desvios positivos predominam os desvios negativos ou ou ouQ3 Q2 = Q2 Q1 Q3 Q2 > Q2 Q1 Q3 Q2 < Q2 Q1
(Medidas de assimetria)Coeficiente de Pearson
Sensvel a valores extremosCoeficiente de Bowley
Pouco Sensvel a valores extremosResultados:
g > 0 = assimetria positivag < 0 = assimetria negativag = 0 = simetria
ANLISE BIVARIADA DE DADOSANLISE DE CORRELAO associao entre varveis (sentido e intensidade)Avaliao grfica - DIAGRAMA DE DISPERSORepresentao dos vrios pares ordenados (x,y) num referencial cartesiano, permitindo visualizar a relao existente entre eles
ASSOCIAO POSITIVA ASSOCIAO NEGATIVA ASSOCIAO NULA (X aumenta; Y aumenta) (X aumenta; Y diminui) (no h qualquer tipo de relao)
A relao (associao) existente entre as variveis pode ser caracterizada quanto a:
FORMALinear pontos tm tendncia para aproximar de uma rectaNo linear pontos tm tendncia para aproximar de uma curvaSENTIDOPositiva ou directa variveis evoluem no mesmo sentido
Negativa ou inversa variveis evoluem em sentido contrrio INTENSIDADEPode ser nula, imperfeita (fraca ou forte), perfeita
Avaliao analtica COVARINCIA
Medida do grau de associao linear (mdia dos produtos dos desvios em relao mdia)
A covarincia sensvel mudana de escala, por este motivo no uma medida adequada para avaliar a intensidade da relao linearcov = 0 (nula) no existe relao linear entre as variveiscov < 0 (negativa) quando uma varivel aumenta a outra diminuicov > 0 (positiva) quando uma varivel aumenta a outra tambm aumenta
Avaliao analtica CORRELAO
* Serve para obviar os inconvenientes da covarincia* O Coeficiente de Correlao (Pearson) mede a intensidade da associao entre as variveis, uma normalizao da covarincia, dividindo-a pelo produtos dos desvios padro* Insensvel escala de medio e de origem* No mede a dependncia funcional, nunca constitui uma prova slida de relaes causais.* permite comparar variveis expressas em unidades diferentes
Intervalo da variao
r =-1 = correlao perfeita negativar < 0 => correlao no perfeita negativar = 0 = correlao nular > 0 => correlao no perfeita positivar = 1 = correlao perfeita positivaem valor absoluto, quanto maior for o coeficiente, maior ser a associao
ANLISE BIVARIADA DE DADOSANLISE DE REGRESSO (linear simples) estuda a relao funcional entre as variveis
Modelo de regresso linearMtodo dos mnimos quadrados (recta de regresso = valor real observado
= recta ajustada
Clculo de b:
Clculo de a, obtm-se pela equao:
Pretende-se ajustar uma recta que minimize o somatrio do quadrado dos resduos
Y = varivel dependente ou endgenaX = varivel independente ou exgenea
e = varivel residual ou erroa = constante, intercepo da recta com o eixo verticalb = constante, declive da recta
Medida da qualidade do ajustamento
O objectivo com que se ajustam as rectas de regresso dos mnimos quadrados e, em geral, o de prever ou predizer o valor de uma das variveis uma vez conhecido o valor da outra. Mas a previso pode ser pior ou melhor. A questo que se pes a de avaliar a qualidade do ajustamento.
o valor do r2 deve ler-se x% da variao do Y explicada pela variao do XIntervalo de variao:
= ausncia de relao linearAs rectas confundem-se, esto sobrepostas ou = implica relao linear perfeita. As rectas confundem-se, esto sobrepostas
Quando existe correlao linear no perfeita, quanto maior o coeficiente de correlao, menor o ngulo formado pelas duas rectas de regresso.