cap4 probabilidade

download cap4 probabilidade

of 22

Transcript of cap4 probabilidade

Noces de Probabilidade e Estatstica o Resoluco dos Exerccios Pares a Captulo 4 Gledson Luiz Picharski Data da ultima atualizao: 2 de Maio de 2008 ca

Seo 4.2 ca2. Vinte e cinco residncias de um certo bairro foram sorteadas e visitadas por um entree vistador que, entre outras questes, perguntou sobre o nmero de televisores. Os dados o u foram os seguintes: 2, 2, 2, 3, 1, 2, 1, 1, 1, 1, 0, 1, 2, 2, 2, 2, 3, 1, 1, 3, 1, 2, 1, 0, 2 Organize os dados numa tabela de freqncia e determine as diversas medidas de posio. ue ca Resposta: > res table(res) res 0 1 2 2 10 10

3 3

> summary(res) #mdia, mediana, quartis, minimo e mximo. e a Min. 1st Qu. 0.00 1.00 Median 2.00 Mean 3rd Qu. 1.56 2.00 Max. 3.00

> moda(res) #para usar a fun~o moda() carregar o pacote dprep. ca [1] 2 1 1

4. Sendo X uma varivel aleatria com funo de probabilidade dada a seguir, obtenha as a o ca medidas de posio , M d e M o. ca X pi -2 0 2 1/3 1/3 1/3

Resposta: J que os valores so igualmente provaveis, podemos supor um conjunto com a mesma a a quantia de cada dado e obter as mediadas de posio, podemos tambm dizer que no ca e a existe moda, por serem valores de mesma probabilidade. > dados summary(dados) Min. 1st Qu. -2 -1 Median 0 Mean 3rd Qu. 0 1 Max. 2

6. Um atacadista recebe de vrios fornecedores uma certa pea para revenda. A pea a c c e produzida com material de qualidade diferente e, portanto, tem custo diferenciado. Levando em conta a proporo fornecida e o preo apresentado por cada fabricante, pode-se ca c admitir que o custo de uma pea em reais, escolhido ao acaso, uma varivel aleatria c e a o (C). Admita a seguinte funo de probabilidade para C: ca C pi 1,00 1,10 1,20 1,30 1,40 0,2 0,3 0,2 0,2 0,1

a) Determine as medidas de posio da varivel C. ca a b) Suponha que o atacadista revenda cada uma dessas peas acrescentando 50% sobre c o custo da pea, alm de um adicional de R$0,10 pelo frete.Calcule as medidas de c e posio da varivel preo de revenda. ca a c Resposta: Suponho uma quantidade de dados proporcional a probabilidade de cada um a) > pea prop.table(table(pea)) c pea c 1 1.1 1.2 1.3 1.4 0.2 0.3 0.2 0.2 0.1 > summary(pea) c Min. 1st Qu. 1.000 1.100 Median 1.150 Mean 3rd Qu. 1.170 1.275 2 Max. 1.400

> moda(pea) c [1] 1.1 b) O preo de revenda obtido com os calculos a seguir. c e > revenda prop.table(table(revenda)) revenda 1.6 1.75 0.2 0.3 1.9 2.05 0.2 0.2 2.2 0.1 Mean 3rd Qu. 1.855 2.013 Max. 2.200

> summary(revenda) Min. 1st Qu. 1.600 1.750 > moda(revenda) [1] 1.75 Median 1.825

Seo 4.3 ca2. A pulsao de 10 estudantes no in de uma prova de estat ca cio stica foram as seguintes (em batimentos por minuto): 80, 91, 84, 86, 93, 88, 80, 89, 85 e 86. Calcule a mdia e a e varincia desse conjunto de dados. a Resposta: Observe que a funo var() serve para calcular a varincia da amostra, para calcularca a mos a varincia da populao devemos usar uma das vrias frmulas(todas equivalentes) a ca a o mostradas pelo livro. > pulsa~o mean(pulsa~o) ca [1] 86.88889

> var(pulsa~o) # esta a vari^ncia para a amostra, pois um estimador consisten ca e a e [1] 15.11111 > mean((pulsa~o-mean(pulsa~o))^2) #vari^ncia da popula~o ca ca a ca [1] 13.4321

3

4. Num certo bairro da cidade de So Paulo, as companhias de seguro estabeleceram o a seguinte modelo para o nmero de ve u culos furtados por semana: 1 2 3 4 Furtos 0 pi 1/4 1/2 1/8 1/16 1/16 Calcule a mdia e a varincia do nmero de furtos semanais desse bairro. e a u Resposta: A seguradora tem esse modelo para toda a populao de ve ca culos que ela segura, ento a usamos a frmula para calcular a varincia no lugar de usar a funo var(). o a ca > veculos prop.table(table(veculos)) veculos 0 1 2 3 4 0.2500 0.5000 0.1250 0.0625 0.0625 > mean(veculos) [1] 1.1875 > mean((veculos - mean(veculos))^2) [1] 1.152344

6. Numa certa cidade, o nmero de crianas em idade escolar, em fam u c lias com 4 lhos, e uma varivel aleatria modelada pela Binomial com parmetros n=4 e p=0,6. Para cada a o a lho em idade escolar, um projeto de apoio ` educao paga 1 salrio m a ca a nimo para a fam lia. Calcule a mdia e a varincia do custo desse projeto por fam e a lia. Resposta: Fao uma simulao dos dados seguindo o modelo binomial, o parametro times do rep() c ca s pode possuir nmeros inteiros, por isso multiplico por mil, sabendo que isso no altera o u a a proporcionalidade e consequentemente no altera a mdia e varincia. a e a > crianas prop.table(table(crianas)) c crianas c 0 1 2 3 4 0.02507523 0.15346038 0.34603811 0.34603811 0.12938816 > mean(crianas) c 4

[1] 2.401204 > mean((crianas - mean(crianas))^2) c c [1] 0.9563877

Seo 4.4 ca2. Estudando uma nova tcnica de satura, foram contados os dias necessrios para a completa e a cicatrizao de determinada cirurgia. Os resultados de 25 pacientes foram os seguintes: ca 6, 8, 9, 7, 8, 6, 6, 7, 8, 9, 10, 7, 8, 10, 9, 9, 9, 7, 6, 5, 7, 7, 8, 10 e 11. Organize os dados numa tabela de freqncia e calcule a mdia e a varincia. ue e a Resposta: Crio um objeto com os dados e calculo os valores pedidos. > dias prop.table(table(dias)) dias 5 6 7 8 9 10 11 0.04 0.16 0.24 0.20 0.20 0.12 0.04 > mean(dias) [1] 7.88 > mean((dias - mean(dias))^2) [1] 2.2656

4. As notas nais de estat stica para os alunos de um curso de Administrao foram as ca seguintes: 7, 5, 4, 5, 6, 3, 8, 4, 5, 4, 6, 4, 5, 6, 4, 6, 6, 3, 8, 4, 5, 4, 5, 5 e 6. a) Determine a mediana e a mdia. e b) Separe o conjunto de dados em dois grupos deniminados aprovados, com nota pelo menos igual a 5, e reprovados para os demais. Compare a varincia desses dois a grupos. Resposta: 5

> notas notas [1] 7 5 4 5 6 3 8 4 5 4 6 4 5 6 4 6 6 3 8 4 5 4 5 5 6 > notas[order(notas)] [1] 3 3 4 4 4 4 4 4 4 5 5 5 5 5 5 5 6 6 6 6 6 6 7 8 8 > median(notas) [1] 5 > median(notas[order(notas)]) [1] 5 > mean function (x, ...) UseMethod("mean") b) Percebemos que a varincia no grupo de aprovados maior, o que signica que entre a e os aprovados existiu uma maior disperso de notas. a > aprovados = 5] > reprovados mean((aprovados - mean(aprovados))^2) [1] 0.984375 > mean((reprovados - mean(reprovados))^2) [1] 0.1728395

6. O departamento de atendimento ao consumidor de uma concessionria de ve a culos recebe, via telefone, as reclamaes dos clientes. O nmero de chamadas dos ultimos 30 dias foram co u anotados e os resultados foram: 3, 4, 5, 4, 4, 5, 6, 9, 4, 4, 5, 6, 4, 3, 6, 7, 4, 5, 4, 5, 7, 8, 8, 5, 7, 5, 4, 5, 7 e 6. a) Construa uma tabela de fraqncia. ue b) Calcule a mdia e o desvio padro. e a c) Admitindo que cada telefonema acarreta servios sob a garantia avaliados em R$50 c por chamada, calcule a mdia e o desvio padro das despesas oriundas do atendie a mento ao consumidor. Resposta: 6

> chamadas prop.table(table(chamadas)) chamadas 3 4 5 6 7 8 9 0.06666667 0.30000000 0.26666667 0.13333333 0.13333333 0.06666667 0.03333333 b) Se tivessemos trabalhando com uma amostra poderiamos usar a funso sd() para ca calcular o desvio padro, mas como se trata de uma populao devemos usar a a ca frmula adequada a situao. o ca > mean(chamadas) [1] 5.3 [1] 1.508863 c) > custo mean(custo) [1] 265 > sqrt(mean((custo-mean(custo))^2))#desvio padr~o do custo. a [1] 75.44314

> sqrt(mean((chamadas-mean(chamadas))^2)) #desvio padr~o da popula~o de chama a ca

8. O tempo, em horas, necessrio para um certo medicamento fazer efeito apresentado a e abaixo: 0.212.712.122.813.300.150.543.120.801.76 1.140.160.310.910.180.041.162.161.480.63 a) Calcule a mdia e a varincia para o conjunto de dados. e a b) Construa uma tabela de freqncia para classes com amplitude de 0,5 hora, comeue cando do zero. c) Suponha que o conjunto original de dados foi perdido e s dispomos da tabela conso tru em (b). Utilizando alguma suposio conveniente, recalcule a mdia e a da ca e varincia e comente as poss a veis diferenas encontradas. c Resposta: > tempo mean(tempo) [1] 1.2845 > mean((tempo - mean(tempo))^2) 7

[1] 1.116895 b) Com o comando range() verico os valores extramos do conjunto de daods, uso o cut para separar em classes, e coloco isso em uma tabela para vericar a frequencia em cada classe. > range(tempo) [1] 0.04 3.30 > y table(ordered(y)) (0,0.5] (0.5,1] (1,1.5] (1.5,2] (2,2.5] (2.5,3] (3,3.5] 6 4 3 1 2 2 2 c) Suponho que o ponto mdio de cada classe substitui o valor original, ento cale a culo a mdia e varincia. As difernas encontradas nos novos valores decorrem da e a e c impreciso em dados resumidos, eles so bem representativos dos dados originais, a a mas obviamente divergem um pouco nas medidas resumo, por no serem os mesmos a valores. > levels(y) mean(as.numeric(levels(y))[y]) [1] 1.325 > mean((as.numeric(levels(y))[y] - mean(as.numeric(levels(y))[y]))^2) [1] 1.081875

10. O Sindicato dos Engenheiros do Estado de So Paulo est estudando o impacto do estgio a a a na obteno de bons empregos. Dentre os engenheiros recm formados e com empregos ca e considerados bons, foi sorteada uma amostra e observado o nmero de anos de estgios u a anteriores ` formatura. a a) Calcule a mdia e a varincia. e a b) Para efeito de anlise, decidiu-se desprezar os valores que se distanciassem da mdia a e amostral por mais de dois desvios padro, isto , s sero considerados os valores no a e o a intervalo xobs 2dpobs . Recalcule o item (a) e comente os resultados. Resposta: Primeiramente crio um objeto com os valores dados pelo livro. > estgio table(estgio) a estgio a 0 1 2 3 25 58 147 105 a) > mean(estgio) a 8 4 72 5 45 6 10

[1] 2.683983 > var var [1] 1.947752 b) Crio um novo objeto que s possui valores dentro do intervalo estabelecido pelo o livro. As nova mdia e varincia divergem da anterior, pois no temos agora outlie a a ers, obviamente a varincia diminui por termos excluido valores mais distntesdos a a outros. > est estgio & estgio > a a a a + mean(estgio) - 2 * sqrt(var)] a > mean(est) [1] 2.610619 > mean((est - mean(est))^2) [1] 1.742188

12. O rgo do Governo Federal encarregado de scalizar a distribuio de energia eltrica o a ca e tem acompanhado o nmero semanal de interrupes de fornecimento numa certa cidade. u co Os dados, referentes `s ultimas 50 semanas, consideraram apenas as interrupes que a co ultrapassaram 3 horas e so apresentados na tabela abaixo. a Interrupes freqncia co ue 0 12 1 14 2 9 3 7 4 3 5 3 6 2 total 50 a) Determine a mdia e a varincia do nmero de interrupes semanais. e a u co b) O Governo Federal aplica uma multa de 10 mil reais por semana, se h pelo menos a uma interrupo no fornecimento. Calcule a mdia e a varincia do valor das multas ca e a aplicadas por semana. c) A Prefeitura dessa cidade fez um levantamento dos preju zos, nos vrios setores, a decorrentes da falta de energia e atribuiu um valor total de 900 mil reais para ser ressarcido pela companhia responsvel pelo fornecimento de eletricidade, referente a ao per odo de 50 semanas. Qual seria o preju mdio por semana? zo e d) Nesse per odo, qual ser a mdia e a varincia do desembolso semanal da companhia a e a , incluindo multa e ressarcimento de preju zo? Resposta: 9

> > > >

freq prej = 1]) * 10000 > prej [1] 380000 > v mean(v) [1] 7.6 > var mean(v + 18) [1] 25.6 > mean((v + 18 - mean(v + 18))^2) [1] 18.24

14. Duas moedas esto sobre a mesa, uma delas tem duas caras e a outra tem probabilidade a igual de cara e de coroa. Sorteamos, ao acaso, uma dessas moedas e lanamos duas vezes. c Seja X a varivel aleatria que conta o nmero de caras nesses dois lanamentos. Qual a o u c e a mdia de X? e 10

Resposta: Assumindo K para coroas e C para caras, fao a Tabela 1 de probabilidades para os eventos c possuveis, ento fao um objeto com quantidade de dados proporcionais `s probabilidades a c a e encontro a mdia. e Eventos Probabilidades CC 0.5 CC 0.125 KC 0.125 CK 0.125 KK 0.125 Tabela 1: Tabela de probabilidades para eventos possiveis. > moedas mean(moedas) [1] 1.5

16. A funo de probabilidade da varivel X P (X = k) = 1/5 para k = 1, 2, ..., 5. Calcule ca a e 2 E(X) e E(X ) e, usando esses reaultados, determine E[(X + 3)2 ] e V ar(3X 2). Resposta: Sabendo que os dados possuem mesma probabilidade, em uma simulao dos dados basta ca crialos em mesma proporo, atravs disso obtemos mdia e varincia. ca e e a > > > > > dados custo = 6))/length(dura~o) ca ca ca > custo [1] 11.5 > preo preo c 12

[1] 31.5

22. Num cassino, um jogador lana dois dados cujas probabilidades so proporcionais aos c a valores das faces. Se sair soma 7, ganha R$50, se sair soma 11, ganha R$100 e se sair soma 2, ganha R$200. Qualquer outro resultado ele no ganha nada. Qual o ganho a e mdio do jogador. e Resposta: Este um caso bem particular, ca um pouco dif generalizar a programao, mas e cil ca mostro duas resolues que considerei interessantes, a primeira um pouco mais pobre, co pois tem menor ecincia computacional, a segunda me pareceu bem mais interessante, e talvez ainda assim outras resolues ainda melhores poderiam surgir. co primeira resoluo. ca > possiveis matrix(possiveis,ncol=6) # matriz de possiveis combina~es de dados. co [,1] "(1,1)" "(2,1)" "(3,1)" "(4,1)" "(5,1)" "(6,1)" [,2] "(1,2)" "(2,2)" "(3,2)" "(4,2)" "(5,2)" "(6,2)" [,3] "(1,3)" "(2,3)" "(3,3)" "(4,3)" "(5,3)" "(6,3)" [,4] "(1,4)" "(2,4)" "(3,4)" "(4,4)" "(5,4)" "(6,4)" [,5] "(1,5)" "(2,5)" "(3,5)" "(4,5)" "(5,5)" "(6,5)" [,6] "(1,6)" "(2,6)" "(3,6)" "(4,6)" "(5,6)" "(6,6)"

[1,] [2,] [3,] [4,] [5,] [6,]

> y matrix(y,ncol=6) # matriz com os resultados de lanamento de dois dados. c [,1] [,2] [,3] [,4] [,5] [,6] 2 3 4 5 6 7 3 4 5 6 7 8 4 5 6 7 8 9 5 6 7 8 9 10 6 7 8 9 10 11 7 8 9 10 11 12

[1,] [2,] [3,] [4,] [5,] [6,] > > > + + + > > >

prob > px x x [1] 75

30. Uma oricultura vende rosas, cravos e jasmins com lucro de, respectivamente, R$10, R$12 e R$15 por dezena. Observa-se que a procura igual para as trs ores. Se o estoque do dia e e no for vendido, a oricultura tem um prju a zo(lucro negativo) de, respectivamente, R$5, R$7 ou R$10 com cada dezena de rosas, cravos ou jasmins. Se a oricultura dispe de duas o dezenas de cada or e trs clientes visitam a oricultura sucessivamente e compram uma e dezena cada um. Fazendo alguma suposio adicional que seja conveniente, determine o ca lucro esperado da loja. Resposta: Para encontrarmos o lucro esperado deveriamos mostrar a funo de probabilidade, mas ca como a situao descrita s apresenta um evento possivel, basta calcular o lucro nesta ca o situao. ca 10(10 + 12 + 15) 10(5 + 7 + 15) = 15 O lucro mdio igual a R$15,00 por dia. e e 32. Para um exame com 25 questes dotipo certo-errado, um estudante sabe a resposta correta o de 17 questes e responde as demais chutando. o a) Calcule a probabilidade dele acertar pelo menos 90% das respostas. b) Determine a mdia e a varincia do nmero de acertos. e a u c) Suponha que nesse mesmo exame, um outro estudante saiba a resposta correta para 15 questes e tenha probabilidade de acerto nas demais de 0,7. Qual dos estudantes o voc espera que tenha malhor desempenho? e d) Nas mesmas condies do item (c), qual dos estudantes ter desempenho mais hoco a mogneo? e Resposta: X Binomial(n, p) n = 25 17 p = 0.5 X : # de acertos do estudante. 16

a) > pbinom(round(0.9 * 25) - 16, 25 - 17, 0.5) [1] 0.9648438 b) Temos que fazer a simulao dos dados, para isso, basta percebermos que todos ca os eventos possiveis so igualmente provaveis, eno geramos os dados possievis em a a mesma proporo e calculamos a mdia e variancia. ca e > dados mean(dados) [1] 21 > mean((dados-mean(dados))^2) [1] 6.666667 c) > 17 + 8 * 0.5 [1] 21 > 15 + 10 * 0.7 [1] 22 d) Perceber qual estudante ter desempenho mais homogneo, signica encontrar menor a e varincia. a > 8 * 0.5 * (1-0.5) # vari^ncia para o primeiro estudante. a [1] 2 > 10 * 0.7 * (1-0.7) # vari^ncia para o segundo estudante. a [1] 2.1 Ento sabemos que o primeiro foi mais homogneo. a e

34. (Use o computador) Considere as observaes contidas no arquivo cancer.txt(ver Exerc co cio 24, Cap tulo 1). a) Obtenha as medidas de posio e de variabilidade para as variveis Idade e Glica a cose(GL). b) Repita o item (a) para cada tipo de diagnstico. Compare as respostas obtidas. o Resposta: > cancer head(cancer) 1 2 3 4 5 6 Ident Grupo Idade AKP P LDH ALB N GL 1 1 71 8.0 3.2 7.8 62 6 113 2 1 66 10.5 5.1 50.1 57 9 93 3 1 83 8.5 3.3 15.3 53 21 109 4 1 52 12.8 3.2 18.8 45 14 91 5 1 61 7.4 4.3 12.9 69 19 78 6 1 54 8.1 2.7 15.9 57 10 122 17

a) > with(cancer,summary(Idade)) Min. 1st Qu. 9.00 37.00 [1] 365.3591 > with(cancer,summary(GL)) Min. 1st Qu. 0.0 91.0 [1] 615.5434 b) > with(cancer, summary(Idade[Grupo == 1])) Min. 1st Qu. 18.00 39.25 [1] 353.4724 > with(cancer, summary(Idade[Grupo == 2])) Min. 1st Qu. 14.00 27.25 [1] 371.1991 > with(cancer, summary(Idade[Grupo == 3])) Min. 1st Qu. 21.00 49.50 [1] 281.3207 > with(cancer, summary(GL[Grupo == 1])) Min. 1st Qu. 72.0 91.0 [1] 259.5623 > with(cancer, summary(GL[Grupo == 2])) Min. 1st Qu. 0.0 89.0 [1] 477.4528 > with(cancer, summary(GL[Grupo == 3])) 18 Median 97.0 Mean 3rd Qu. 100.9 106.0 Max. 180.0 Median 96.0 Mean 3rd Qu. 100.0 105.2 Max. 153.0 Median 60.00 Mean 3rd Qu. 58.69 68.50 Max. 103.00 Median 44.00 Mean 3rd Qu. 45.68 60.75 Max. 85.00 Median 55.00 Mean 3rd Qu. 53.27 65.25 Max. 101.00 Median 99.0 Mean 3rd Qu. 104.3 111.0 Max. 298.0 Median 54.00 Mean 3rd Qu. 51.21 66.00 Max. 103.00

> with(cancer,var(Idade)) # Vari^ncia amostral a

> with(cancer,var(GL))

> with(cancer, var(Idade[Grupo == 1]))

> with(cancer, var(Idade[Grupo == 2]))

> with(cancer, var(Idade[Grupo == 3]))

> with(cancer, var(GL[Grupo == 1]))

> with(cancer, var(GL[Grupo == 2]))

Min. 1st Qu. 72.0 94.5 [1] 742.2905

Median 105.0

Mean 3rd Qu. 111.2 120.0

Max. 247.0

> with(cancer, var(GL[Grupo == 3]))

36. (Use o computador) As variveis desse exerc a cio fazem parte do arquivo aeusp.txt(ver Exerc 26, Cap cio tulo 1). a) Obtenha as medidas de posio e de variabilidade para as variveis Itrab e Renda. ca a b) Repita o item (a) para cada uma das comunidades estudadas. Existem diferenas c entre elas? c) Utilizando os valores da varivel Serif, divida os moradores em trs categorias: os a e a que no pararam de estudar, aqueles que pararam at a 8 srie e os demais. Para a e e cada uma das categorias, obtenha as medidas de posio e a varincia da varivel ca a a Itrab. d) Baseado nas variveis Sexo e Itrab, vocdiria que os homens comeam a trabalhas a e c mais cedo? Resposta: > se head(se) 1 2 3 4 5 6 1 2 3 4 5 6 > > > > > >

Num Comun Sexo Idade Ecivil X.Reproce X.Temposp X.Resid Trab Ttrab X.Itrab 1 JdRaposo 2 4 4 Nordeste 21 9 3 NA 20 2 JdRaposo 2 1 1 Sudeste 24 9 1 1 14 3 JdRaposo 2 2 1 Nordeste 31 3 1 1 14 4 JdRaposo 1 2 2 Nordeste 10 3 1 4 10 5 JdRaposo 2 4 2 Nordeste 31 6 1 1 11 6 JdRaposo 2 4 2 Sudeste 24 4 2 NA 15 X.Renda X.Acompu X.Serief 1 2 1 2 2 7 5 2 7 5 2 11 6 1 4 4 2 4 with(se, with(se, with(se, with(se, with(se, with(se, Sexo[Sexo != 1 & Sexo != 2] 4] 5] 25] 35] 45] > > > > > >

with(se, with(se, with(se, with(se, with(se, with(se, with(se,

X.Temposp[X.Temposp[Idade == 4] > Inf] with(se, summary(X.Renda)) Min. 1st Qu. 1.000 2.000 [1] 1.934348 b) > with(se, summary(X.Itrab[Comun == (levels(Comun))[1]])) Min. 1st Qu. 5.00 12.00 [1] 17.80964 > with(se, summary(X.Renda[Comun == (levels(Comun))[1]])) Min. 1st Qu. 1.000 4.000 [1] 1.588646 > with(se, summary(X.Itrab[Comun == (levels(Comun))[2]])) Min. 1st Qu. 5.00 10.25 [1] 23.53285 > with(se, summary(X.Renda[Comun == (levels(Comun))[2]])) Min. 1st Qu. 1.00 2.00 [1] 1.530204 20 Median 3.00 Mean 3rd Qu. 2.98 4.00 Max. 6.00 Median 12.00 Mean 3rd Qu. 13.02 14.75 Max. 35.00 NAs 4.00 Median 4.000 Mean 3rd Qu. 4.151 5.000 Max. 6.000 Median 13.00 Mean 3rd Qu. 13.65 16.00 Max. 29.00 NAs 9.00 Median 4.000 Mean 3rd Qu. 3.405 4.000 Max. 6.000

> with(se, var(X.Itrab, na.rm = T))

> with(se, var(X.Renda))

> with(se, var(X.Itrab[Comun == (levels(Comun))[1]], na.rm = T))

> with(se, var(X.Renda[Comun == (levels(Comun))[1]]))

> with(se, var(X.Itrab[Comun == (levels(Comun))[2]], na.rm = T))

> with(se, var(X.Renda[Comun == (levels(Comun))[2]]))

> with(se, summary(X.Itrab[Comun == (levels(Comun))[3]])) Min. 1st Qu. 4.00 10.00 [1] 20.84056 > with(se, summary(X.Renda[Comun == (levels(Comun))[3]])) Min. 1st Qu. 1.000 3.000 [1] 2.375 > with(se, summary(X.Itrab[Comun == (levels(Comun))[4]])) Min. 1st Qu. 7.00 10.00 [1] 17.75376 > with(se, summary(X.Renda[Comun == (levels(Comun))[4]])) Min. 1st Qu. 1.000 2.000 [1] 1.567504 > with(se, summary(X.Itrab[Comun == (levels(Comun))[5]])) Min. 1st Qu. 7.00 10.00 [1] 18.71070 > with(se, summary(X.Renda[Comun == (levels(Comun))[5]])) Min. 1st Qu. 1.000 2.000 [1] 1.894236 > with(se, summary(X.Itrab[Comun == (levels(Comun))[6]])) Min. 1st Qu. 5.00 11.75 [1] 11.69167 > with(se, summary(X.Renda[Comun == (levels(Comun))[6]])) 21 Median 14.00 Mean 3rd Qu. 13.52 15.25 Max. 19.00 NAs 7.00 Median 3.500 Mean 3rd Qu. 3.323 4.000 Max. 6.000 Median 14.00 Mean 3rd Qu. 13.34 17.00 Max. 22.00 NAs 3.00 Median 3.000 Mean 3rd Qu. 2.864 4.000 Max. 6.000 Median 14.00 Mean 3rd Qu. 13.47 16.00 Max. 28.00 NAs 2.00 Median 4.000 Mean 3rd Qu. 3.556 5.000 Max. 6.000 Median 14.00 Mean 3rd Qu. 13.27 15.00 Max. 34.00 NAs 8.00

> with(se, var(X.Itrab[Comun == (levels(Comun))[3]], na.rm = T))

> with(se, var(X.Renda[Comun == (levels(Comun))[3]]))

> with(se, var(X.Itrab[Comun == (levels(Comun))[4]], na.rm = T))

> with(se, var(X.Renda[Comun == (levels(Comun))[4]]))

> with(se, var(X.Itrab[Comun == (levels(Comun))[5]], na.rm = T))

> with(se, var(X.Renda[Comun == (levels(Comun))[5]]))

> with(se, var(X.Itrab[Comun == (levels(Comun))[6]], na.rm = T))

Min. 1st Qu. 1.000 2.000 [1] 1.151711

Median 3.000

Mean 3rd Qu. 3.021 4.000

Max. 5.000

> with(se, var(X.Renda[Comun == (levels(Comun))[6]])) c) > with(se, summary(X.Itrab[is.na(X.Serief)])) Min. 1st Qu. 5.00 9.00 [1] 25.66063 > with(se, summary(X.Itrab[X.Serief with(se, summary(X.Itrab[X.Serief > 8])) Min. 1st Qu. 7.00 13.00 [1] 10.98847 d) Ao calcularmos a mdia da idade inicial para trabalho, percebemos que os homens e comeam a trabalhar mais cedo. c > with(se, mean(X.Itrab[Sexo == 1], na.rm = T)) [1] 12.5 > with(se, mean(X.Itrab[Sexo == 2], na.rm = T)) [1] 14.10714 Median 15.00 Mean 3rd Qu. 14.77 16.00 Max. 24.00 NAs 76.00 Median 13.00 Mean 3rd Qu. 13.16 16.00 Max. 35.00 NAs 82.00 Median 11.00 Mean 3rd Qu. 12.42 15.00 Max. 34.00 NAs 21.00

> with(se, var(X.Itrab[is.na(X.Serief)], na.rm = T))

> with(se, var(X.Itrab[X.Serief with(se, var(X.Itrab[X.Serief > 8], na.rm = T))

22