AulaR2

29
An´ alise Explorat´ oria de Dados Introdu¸ ao ao R Jo˜ ao Batista M. Pereira DME - UFRJ [email protected] AULA 2 2015/1 Jo˜ ao Batista M. Pereira An´ alise Explorat´ oria de Dados 1 / 22

description

Analise de dados no software R.

Transcript of AulaR2

AnaliseExplorat oriadeDadosIntrodu [email protected]/1JoaoBatistaM.Pereira AnaliseExploratoriadeDados 1/22SobreoROR eumsoftwarelivreepodeserobtidoemhttp://www.r-project.org.NaopcaoCRAN,selecioneoservidordoqualpretendebaixarosoftwareEscolhaaplataforma(Linux,MACouWindows)eobede caasinstrucoesdedownload.JoaoBatistaM.Pereira AnaliseExploratoriadeDados 2/22Operac oesBasicas+: soma;-: subtra cao;: multiplica cao;/: divisao;: potencia cao;%%: restodadivisao;%/%: parteinteiradadivisao;%%: multiplicamatrizes;==,!=: argumentosl ogicos: igualediferente,respectivamente;=: menor,menorigual,maioremaiorigual,respectivamente;;: utilizadoparaseparardiferentecomandosemumamesmalinha.JoaoBatistaM.Pereira AnaliseExploratoriadeDados 3/22ComandosBasicossqrt(): raizquadrada;abs(): valorabsoluto;exp(): exponencial;log10()elog2(): logaritmonabase10enabase2,respectivamente;log(,base=): logaritmoemqualquerbase,padrao eologaritmoneperiano;sin(),cos(),tan(): funcoestrigonometricas(emradianos);asin(),acos(),atan(): funcoestrigonometricasinversas;factorial(n): n!choose(a,b):

ab

.JoaoBatistaM.Pereira AnaliseExploratoriadeDados 4/22ComandosBasicossetwd("C:\\...")ousetwd("C:/..."): mudaodiretoriodetrabalho;getwd(): mostraodiretoriodetrabalho;ls(): listaonomedosobjetoscriadosnasessaoatual;dir(): listatodososarquivosnapastadetrabalhoatualsearch(): listatodosospacotescarregadoslibrary(): ativabiblioteca/pacoteinstaladorm(): removeosobjetosentreparentesesrm(list=ls()): removetodososobjetos,limpandoamemoria;#: parainserircomentarios.JoaoBatistaM.Pereira AnaliseExploratoriadeDados 5/22EstruturadosDadosConjuntosdedadosnoR,maisfrequentemente,estaonoformatodevetores,matrizesoudataframes.Paranosreferirmosaumadeterminadaposicaoideumvetordenominadovetor,fazemosvetor[i]Paranosreferirmosaumadeterminadaposicao(i,j)deumamatrizdenominadamatriz,fazemosmatriz[i,j] # linha i, coluna jJoaoBatistaM.Pereira AnaliseExploratoriadeDados 6/22EstruturadosDadosConjuntosdedadosnoR,maisfrequentemente,estaonoformatodevetores,matrizesoudataframes.Paranosreferirmosaumadeterminadaposicaoideumvetordenominadovetor,fazemosvetor[i]Paranosreferirmosaumadeterminadaposicao(i,j)deumamatrizdenominadamatriz,fazemosmatriz[i,j] # linha i, coluna jJoaoBatistaM.Pereira AnaliseExploratoriadeDados 6/22EstruturadosDadosParanosreferirmosaumadeterminadalinhaidestamatriz,fazemosmatriz[i,] # todas as colunas da linha iParanosreferirmosaumadeterminadacolunajdestamatriz,fazemosmatriz[,j] # todas as linhas da coluna jSeumconjuntodedadosxapresentanomesnascolunas,podemosutilizarocomandoattach(x)paranosreferirmosaestascolunaspelonome.Paraacessarumadeterminadaposi caodeumdataframe,procede-sedamesmaformaqueparamatrizes.JoaoBatistaM.Pereira AnaliseExploratoriadeDados 7/22EstruturadosDadosParanosreferirmosaumadeterminadalinhaidestamatriz,fazemosmatriz[i,] # todas as colunas da linha iParanosreferirmosaumadeterminadacolunajdestamatriz,fazemosmatriz[,j] # todas as linhas da coluna jSeumconjuntodedadosxapresentanomesnascolunas,podemosutilizarocomandoattach(x)paranosreferirmosaestascolunaspelonome.Paraacessarumadeterminadaposi caodeumdataframe,procede-sedamesmaformaqueparamatrizes.JoaoBatistaM.Pereira AnaliseExploratoriadeDados 7/22EstruturadosDadosParanosreferirmosaumadeterminadalinhaidestamatriz,fazemosmatriz[i,] # todas as colunas da linha iParanosreferirmosaumadeterminadacolunajdestamatriz,fazemosmatriz[,j] # todas as linhas da coluna jSeumconjuntodedadosxapresentanomesnascolunas,podemosutilizarocomandoattach(x)paranosreferirmosaestascolunaspelonome.Paraacessarumadeterminadaposi caodeumdataframe,procede-sedamesmaformaqueparamatrizes.JoaoBatistaM.Pereira AnaliseExploratoriadeDados 7/22EstatsticasDescritivasAlgumasdasmaisimportantesestatsticasdescritivassao:mean(x): mediadeumavariavel x;median: medianadeumavariavel x;var(x): varianciadeumavariavel x;sd(x): desviopadraodeumavariavel x;quantile(x,p): quantilpdeumavariavel x;summary(x): retornaumconjuntodeestatsticasdavariavel x;table(x):retornaafrequenciadosvaloresdavariavel x;cov(x,y): covarianciaentreasvariaveisxey;cor(x,y): correla caoentreasvariaveisxey.JoaoBatistaM.Pereira AnaliseExploratoriadeDados 8/22PedindoAjuda! HelpdoROhelpdoR ebastanteeciente.Quando echamado,umapaginaseabrecomexplica coeseexemplosarespeitodafun caooucomandodeinteresse.Hadiversasmaneirasdechamarohelp.help(nome.da.funcao): quandosabe-seonomedafun cao;?nome.da.funcao: fazomesmoqueocomandoanterior;help.search("palavra.chave"): buscaporpalavra-chave;??palavra.chave: fazomesmoqueocomandoanterior;example(nome.da.funcao): mostraexemplosdafuncao.JoaoBatistaM.Pereira AnaliseExploratoriadeDados 9/22PedindoAjuda! HelpdoROhelpdoR ebastanteeciente.Quando echamado,umapaginaseabrecomexplica coeseexemplosarespeitodafun caooucomandodeinteresse.Hadiversasmaneirasdechamarohelp.help(nome.da.funcao): quandosabe-seonomedafun cao;?nome.da.funcao: fazomesmoqueocomandoanterior;help.search("palavra.chave"): buscaporpalavra-chave;??palavra.chave: fazomesmoqueocomandoanterior;example(nome.da.funcao): mostraexemplosdafuncao.JoaoBatistaM.Pereira AnaliseExploratoriadeDados 9/22AnaliseGracaHistograma: hist(x): faz um histograma dos valores de uma variavelx.freq=TRUE:consideraoeixodasordenadascomoafrequenciaabsoluta(padrao);prob=TRUE:consideraoeixodasordenadascomoafrequenciarelativa.JoaoBatistaM.Pereira AnaliseExploratoriadeDados 10/22AnaliseGracaGracodebarras: barplot(x): fazumgracodebarrascomdosvaloresdeumavariavel x(frequencia).horiz=FALSE:gracocombarrasverticias(padrao);horiz=TRUE:gracocombarrashorizontais;names.arg=vetor.de.nomes: nomesdascategorias.JoaoBatistaM.Pereira AnaliseExploratoriadeDados 11/22AnaliseGracaGracodesetores: pie(x): fazumgracodesetores(pizza)dosvaloresdeumavariavel x(frequencia).clockwise=FALSE:graconosentidoanti-horario(padrao);clockwise=TRUE:graconosentidohorario;labels=vetor.de.nomes: nomesdascategorias.JoaoBatistaM.Pereira AnaliseExploratoriadeDados 12/22AnaliseGracaGracogenerico: plot(x)ouplot(x,y): fazdiversostiposdegracosparavaloresdeumavariavel xouumpardevariaveis(x,y).type=p: gracodepontos(padrao);type=l: gracodelinhas;type=b: gracodelinhasepontos;type=c: gracodelinhassempontos;type=o: gracodelinhasepontossobrespostos;type=h: gracodelinhasverticais;type=s: gracodedegraus;type=S: gracodedegrausinvertidos;type=n: naoplotanada.JoaoBatistaM.Pereira AnaliseExploratoriadeDados 13/22AnaliseGracaBox-plot: boxplot(x): fazumgracobox-plotdosvaloresdeumavariavel x.horizontal=FALSE:box-plotvertical(padrao);horizontal=TRUE:box-plothorizontal.JoaoBatistaM.Pereira AnaliseExploratoriadeDados 14/22AnaliseGracaLinhasobreposta: lines(x)oulines(x,y): fazumgracodelinhaparavaloresdeumavariavel xouumpardevariaveis(x,y)sobrepostoaumgracoativo.Pontossobrepostos: points(x)oupoints(x,y): fazumgracodepontosparavaloresdeumavariavel xouumpardevariaveis(x,y)sobrepostoaumgracoativo.JoaoBatistaM.Pereira AnaliseExploratoriadeDados 15/22ImportandoDadosORpodelerdadosdearquivosimportando-osparaseremanalisados.Haduasmaneirasdefazerisso:(i)especicandotodoocaminhodoarquivo;(ii)especicandoapenasonomedoarquivoseeleestivernodiretoriodetrabalho.JoaoBatistaM.Pereira AnaliseExploratoriadeDados 16/22ImportandoDados(AlgunsComandos)read.table("nome.do.arquivo.txt",header=TRUE):paralerarquivos.txt;seheader=TRUE,consideraaprimeiralinhacomoosnomesdascolunas(opadrao eFALSE).Exemplos:Lendodadosdeumarquivonodiretoriodetrabalho:dados