Raciocínio Lógico - Aula 09

72
Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística Profs. Alexandre Lima e Moraes Junior Aula 9 - Questões Comentadas e Resolvidas Variável Aleatória Bivariada: função de probabilidade conjunta, função de probabilidade marginal, função de probabilidade condicional. Variáveis aleatórias independentes. Esperanças envolvendo duas ou mais variáveis: correlação e covariância. Introdução à Regressão Linear. 1. (Analista da SUSEP/Atuária/2001/ESAF) Uma loja vende lavadoras e secadoras de roupa. A distribuição conjunta do número N1 de secadoras e do número N2 de lavadoras vendidas num mesmo dia é dada na tabela abaixo. Assinale a opcão que dá a probabilidade de que a venda, num mesmo dia, de lavadoras seja igual à de secadoras. N1 N2 0 1 2 3 0 0,25 0,13 0,04 0,02 1 0,15 0,11 0,02 0,01 2 0,08 0,06 0,05 0,02 3 0,01 0,01 0,01 0,03 (A) 0,54 (B) 0,50 (C) 0,49 (D) 0,44 (E) 0,19 Resolução Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br REVISÃO DA NOÇÃO DE FUNÇÃO DE PROBABILIDADE CONJUNTA Na aula anterior, estudamos distribuições de probabilidade para uma única variável aleatória. Entretanto, em muitas situações práticas, atribuímos a um mesmo ponto amostral os valores de duas ou mais variáveis aleatórias ao descrevermos os resultados de um experimento. Nesta aula, nos concentraremos no caso de um par de variáveis aleatórias. Exemplo: Considere o lançamento simultâneo de duas moedas não viciadas. Os resultados desse experimento aleatório são cara-cara (CC), cara-coroa (CK), coroa-cara (KC) e coroa-coroa (KK). Logo, o espaço amostral é CK, KC, KK}. Defina as variáveis aleatórias X=0 se pelo menos uma das moedas der cara (X=1 para os demais casos) e Y=-1 se der uma cara e uma coroa (Y=+1 para os demais casos). Então 1

description

Raciocínio Lógico - curso

Transcript of Raciocínio Lógico - Aula 09

Page 1: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Aula 9 - Questões Comentadas e Resolvidas

Variável Aleatória Bivariada: função de probabilidade conjunta, função de probabilidade marginal, função de probabilidade condicional. Variáveis aleatórias independentes. Esperanças envolvendo duas ou mais variáveis: correlação e covariância. Introdução à Regressão Linear.

1. (Analista da SUSEP/Atuária/2001/ESAF) Uma loja vende lavadoras e secadoras de roupa. A distribuição conjunta do número N1 de secadoras e do número N2 de lavadoras vendidas num mesmo dia é dada na tabela abaixo. Assinale a opcão que dá a probabilidade de que a venda, num mesmo dia, de lavadoras seja igual à de secadoras.

N1 N2 0 1 2 3 0 0,25 0,13 0,04 0,02 1 0,15 0,11 0,02 0,01 2 0,08 0,06 0,05 0,02 3 0,01 0,01 0,01 0,03

(A) 0,54

(B) 0,50

(C) 0,49

(D) 0,44

(E) 0,19

Resolução

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br

REVISÃO DA NOÇÃO DE FUNÇÃO DE PROBABILIDADE CONJUNTA

Na aula anterior, estudamos distribuições de probabilidade para uma única variável aleatória. Entretanto, em muitas situações práticas, atribuímos a um mesmo ponto amostral os valores de duas ou mais variáveis aleatórias ao descrevermos os resultados de um experimento. Nesta aula, nos concentraremos no caso de um par de variáveis aleatórias.

Exemplo: Considere o lançamento simultâneo de duas moedas não viciadas. Os resultados desse experimento aleatório são cara-cara (CC), cara-coroa (CK), coroa-cara (KC) e coroa-coroa (KK). Logo, o espaço amostral é CK, KC, KK}. Defina as variáveis aleatórias X=0 se pelo menos uma das moedas der cara (X=1 para os demais casos) e Y=-1 se der uma cara e uma coroa (Y=+1 para os demais casos). Então

1

Page 2: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

P[X=0] = P[CC] + P[CK] + P[KC] = 1/4 + 1/4 + 1/4 = 3/4,

P[X=1] = P[KK] = 1/4 = 1 - P[X=0],

P[Y=-1] = P[CK] + P[KC] = 1/2 e

P[Y= + 1] = P[CC] + P[KK] = 1/2 = 1 - P[Y=-1].

Considere o evento resultante da interseção dos eventos obter pelo menos uma cara e não obter uma cara e uma coroa, ou seja, {(CC u CK u KC) n (CC u KK)} = {CC}. Esse evento pode ser representado pela notação compacta (X=0,Y= + 1). Como P(CC) = 1/4, temos que P(X=0,Y= + 1) = 1/4. O evento (X=0,Y= + 1) é dito conjunto porque envolve as variáveis X e Y.

Os demais eventos conjuntos são: (X=0,Y=-1), (X=1,Y= + 1) e (X=1,Y=-1). Diz-se que o par (X,Y) é uma variável aleatória bivariada ou bidimensional.

Exemplo: A variável aleatória contínua X representa o comprimento de uma dimensão de uma peça moldada por injeção, enquanto a variável aleatória contínua Y denota o comprimento de outra dimensão. Estamos interessados em probabilidades que possam ser escritas em termos de X e Y. Suponha que as especificações para X e Y sejam (3,95 a 4,05) e (8,10 a 8,20) milímetros, respectivamente. Então podemos estar interessados na probabilidade de uma peça satisfazer as duas especificações simultaneamente, ou seja, P[(3,95 < X < 4,05) e (8,10 < Y < 8,20)].

Variáveis Discretas

Sejam X e Y variáveis aleatórias discretas, como no primeiro exemplo dado. Então a função discreta de probabilidade conjunta (ou distribuição conjunta) de X e Y, denotada por f(x,y), satisfaz

1 HILL, R. Carter; GRIFFITHS, William E.; JUDGE, George G. Econometria. 2. ed. São Paulo: Saraiva, 2006. Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 2

Exemplo1: Um total de 15.064.859 alunos está matriculado no ensino superior, divididos entre cursos com duração de 4 anos, de 2 anos e de menos de 2 anos. A matrícula, separada por sexo, é mostrada na tabela a seguir.

Page 3: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

4 anos 2 anos Menos de 2 anos Homens 4.076.416 2.437.905 172.874 Mulheres 4.755.790 3.310.086 311.788 Fonte: Digest of Educational Statistics 1997, Tabela 170.

Nessa população, as probabilidades aproximadas de matrícula em um dos tipos de instituição de ensino superior, por sexo, são

4 anos 2 anos Menos de 2 anos Homens 0,27 0,16 0,01 Mulheres 0,32 0,22 0,02

Considere o experimento de extrair aleatoriamente um estudante matriculado dessa população. Defina a variável aleatória X = 0, se um homem é selecionado, e X = 1, se uma mulher é selecionada. Defina a variável aleatória Y = 1, se o estudante escolhido é de um curso de 4 anos, Y = 2, se o estudante escolhido é de um curso de 2 anos e Y = 3, se é de um curso de menos de 2 anos.

Seja f(x,y) a função discreta de probabilidade conjunta da população de homens e mulheres da questão. Sendo assim, temos as seguintes probabilidades conjuntas:

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 3

P(homens matriculados em cursos de 4 anos)

P(homens matriculados em cursos de 2 anos)

P(homens matriculados em cursos < 2 anos)

P(mulheres matriculadas em cursos de 4 anos)

P(mulheres matriculadas em cursos de 2 anos)

P(mulheres matriculadas em cursos < 2 anos)

Note que

é a probabilidade do evento certo.

Variáveis Contínuas

Sejam X e Y duas variáveis aleatórias contínuas. Neste caso, a distribuição conjunta das duas variáveis é caracterizada por uma função f(x,y) chamada função de densidade conjunta de X e Y, que satisfaz

Page 4: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

A equação (3) dá a probabilidade do par (x,y) estar num retângulo de lados b-a e d-c.

Exemplo: Suponha que a variável aleatória (X,Y) esteja uniformemente distribuída no quadrado da figura abaixo.

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 4

(2)

(3)

A relação (2) nos diz que o volume sob a superfície representada por f(x,y) é igual a 1. A figura abaixo mostra uma função de densidade conjunta.

Exemplo:

e a probabilidade

Page 5: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

contrário. A figura a seguir ilustra a densidade conjunta uniforme (é a superfície delimitada pelo perímetro azul). Sabemos que o volume do cubo deve ser 1 x 1 x K = 1, pois o volume delimitado por uma densidade de probabilidade conjunta é igual a 1 por definição. Logo, K =1 é a altura do cubo.

GABARITO: D

Julgue os itens a seguir.

2. Seja a distribuição conjunta de X e Y

5 Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br

Então, a densidade marginal fX(x) é dada por

Page 6: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Resolução

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 6

Como fX(x) é uma função exponencial de x, e não de y, temos que o item está errado.

REVISÃO DA NOÇÃO DE FUNÇÃO DE PROBABILIDADE MARGINAL

Dada uma função densidade de probabilidade conjunta, pode-se obter a função densidade de probabilidade de cada uma das variáveis aleatórias individuais.

Sejam X e Y variáveis aleatórias contínuas com densidade conjunta f(x,y). Então fX(x) e fY(y) são denominadas densidades marginais de X e Y, respectivamente, se são obtidas de f(x,y) por meio das expressões

Note que as funções de densidade de probabilidade marginal fX(x) e fY(y) correspondem às funções de densidade de probabilidade individuais de X e Y, respectivamente.

Pode-se obter resultados similares para variáveis aleatórias discretas. Dada a função discreta de probabilidade conjunta f(xi,yk), as funções discretas de probabilidade marginal são dadas por

Page 7: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Exemplo: Considere a tabela abaixo (exemplo visto na resolução do exercício 1).

4 anos (Y=1)

2 anos (Y=2)

Menos de 2 anos (Y=3)

Homens (X=0) 0,27 0,16 0,01 Mulheres (X=1) 0,32 0,22 0,02

A probabilidade P[X = 0] (probabilidade de o estudante escolhido

aleatoriamente ser homem) é igual à probabilidade marginal fX (x) no ponto x

A probabilidade P[X = 1], probabilidade de o estudante selecionado

aleatoriamente ser mulher, é igual à probabilidade marginal fX (x) no ponto x

=1. Então

Note que fX(x=0) + fX(x=1) = 0,44 + 0,56 = 1, e isto acontece porque a soma das probabilidades de uma função discreta de probabilidades é unitária, por definição.

A probabilidade P[Y = 1], que representa a probabilidade de o estudante escolhido ao acaso estar matriculado em um curso de 4 anos, é igual à probabilidade marginal fY (y) no ponto y =1, dada por

soma da 1a coluna da tabela.

A probabilidade P[Y = 2] é a probabilidade de o estudante estar matriculado em

um curso de 2 anos e é igual à probabilidade marginal fY (y) no ponto y =2:

7 Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br

Page 8: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Y=1 Y=2 Y=3 fX(x) X=0 0,27 0,16 0,01 0,44 X = 1 0,32 0,22 0,02 0,56

fY(y) 0,59 0,38 0,03 1

A tabela acima mostra que as probabilidades marginais fX(x) e fY(y) são obtidas somando as linhas e colunas, respectivamente (memorize para a prova!).

GABARITO: Errado

3. Sejam X e Y variáveis aleatórias discretas com a seguinte distribuição conjunta:

Y=1 Y=2 Y=3 X=0 0,27 0,16 0,01 X = 1 0,32 0,22 0,02

Então a tabela abaixo especifica a distribuição condicional de X dado que Y=1:

x 0 1 fX|Y(x y=1) 0,458 0,542

Resolução

Finalmente, a probabilidade P[Y = 3] denota a probabilidade de o estudante estar matriculado em um curso com duração menor que 2 anos e corresponde à probabilidade marginal fY (y) no ponto y =3:

soma da 3a coluna da tabela.

Não por acaso, temos que = 1.

As probabilidades condicionais especificam a distribuição condicional de X dado que Y=1, denotada por probabilidade condicional, obtemos

Da definição de

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 8

Page 9: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Assim,

P(X=0|Y=1) = P(X=0,Y=1)/P(Y=1) = 0,27/0,59 = 0,458

e

P(X=1|Y=1) = P(X=1,Y=1)/P(Y=1) = 0,32/0,59 = 0,542.

Note que P(X=0|Y=1) + P(X=1|Y=1) = 0,458 + 0,542 = 1. O item está certo.

COMENTÁRIOS ADICIONAIS

A média da distribuição condicional de X, dado que Y=1, é

E(X|Y=1) = (0 x 0,458) + (1 x 0,542) = 0,542.

As probabilidades condicionais P(Y=y|X=1) especificam a distribuição condicional de Y dado que X=1. Aplicando a probabilidade condicional, obtemos

P(Y=1|X=1) = P(Y=1,X = 1)/P(X=1) = 0,32/0,56 = 0,571,

P(Y=2|X=1) = P(Y=2,X = 1)/P(X=1) = 0,22/0,56 = 0,393,

P(Y=3|X=1) = P(Y=3,X = 1)/P(X=1) = 0,02/0,56 = 0,036.

De modo que a distribuição condicional de Y, dado que X=1, denotada por

A média da distribuição condicional de Y, dado que X=1, é igual a

E(Y|X=1) = (1 x 0,571) + (2 x 0,393) + (3 x 0,036) = 1,465.

Formalizemos o que foi visto acima. Sejam X e Y variáveis aleatórias discretas com função de probabilidade conjunta f(xi,yk). Então as funções discretas de probabilidade condicional (ou distribuições condicionais)

são definidas como

9 Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br

está na tabela abaixo:

Page 10: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

e a densidade condicional de X dado o resultado Y = y como

A fórmula (3) também é válida para o caso de variáveis contínuas.

A interpretação de (5) e (6) é a seguinte. Seja a densidade conjunta

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 10

De (1) e (2) resulta que

(3)

A esperança condicional de X, dado que Y = yj, é dada por

(4)

Uma definição análoga vale para

Podemos definir as densidades condicionais associadas a duas variáveis aleatórias contínuas X e Y (com densidade conjunta e densidades marginais de forma similar. A densidade condicional de Y dado o resultado X = x é definida por

(5)

(6)

= 0 caso contrário

representada na figura a seguir. Considere o plano paralelo ao plano xz que passa por Esse plano determina na superfície a densidade condicional Por exemplo, suponha que X denote o salário de uma população e que Y represente o consumo da mesma população. Então, fixado o consumo a densidade condicional representa a densidade dos salários para o nível de consumo.

Page 11: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

esperança condicional de Y, dado que X=x,

Note que E(Y|x) é, de fato, uma função de x.

GABARITO: Certo

4. Considere a função de distribuição conjunta

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 11

A é dada por

As densidades condicionais também podem ser caracterizadas por meio de suas médias, variâncias, etc.

(7)

Definição análoga pode ser dada para E(X|y). Observe que E(Y|x) é uma função de x, isto é, E(Y|x) = f(x), sendo denominada curva de regressão de Y sobre x. A regressão será vista em detalhes mais adiante.

Exemplo: Seja a densidade condicional

A esperança condicional E(Y|x) é dada por

Page 12: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 12

Pode-se afirmar que X e Y são variáveis aleatórias independentes.

Resolução

Vimos que as densidades marginais da densidade conjunta

x>0, y>0

são dadas por

Como concluímos que X e Y são independentes.

REVISÃO DA NOÇÃO DE VARIÁVEIS ALEATÓRIAS INDEPENDENTES

Quando X e Y são variáveis aleatórias independentes a função de probabilidade conjunta é igual ao produto das funções marginais de probabilidade, ou seja

Podemos generalizar a fórmula acima. Sejam variáveis aleatórias independentes com função de probabilidade conjunta

e funções marginais de probabilidade

a expressão

Então é válida

densidade conjunta é igual ao

produto das densidades marginais.

Se X e Y são independentes; então a densidade condicional de X, dado que Y = y é,

distribuição condicional de X dado Y

não depende da variável Y; é função somente de X.

e a densidade condicional de Y, dado que X = x é,

Page 13: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Aplicando esse conceito na integral de E[XY], obtemos

Note que variáveis independentes são não correlacionadas, uma vez que a covariância entre X e Y é nula:

REVISÃO DOS CONCEITOS DE CORRELAÇÃO E COVARIÂNCIA

Introdução

É muito comum estarmos interessados no comportamento conjunto de duas ou mais variáveis aleatórias. Apresentamos para você os conceitos de funções de probabilidade conjunta, marginal e condicional para variáveis discretas e contínuas. Também estudamos a noção de independência entre variáveis aleatórias.

Aqui, daremos continuidade ao estudo da associação entre variáveis. Frequentemente, estamos interessados em saber se existe uma associação entre duas variáveis. Considere, por exemplo, a Economia. Em geral, estamos

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 13

distribuição condicional de Y dado X

não depende da variável X; é função somente de Y.

GABARITO: Certo

5. As variáveis aleatórias X e Y são independentes. Então é válida a expressão

Resolução

Provaremos que E[XY] = E[X]E[Y] supondo que X e Y sejam variáveis contínuas. Prova similar pode ser dada se as variáveis forem discretas (tente você mesmo fazer após estudar a nossa solução para variáveis contínuas).

Primeiramente, lembre que pois X e Y são independentes.

Page 14: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior interessados em investigar as relações que possam existir entre variáveis econômicas. Por exemplo: quão estreitamente caminham duas variáveis preço? Veremos que os conceitos de covariância e correlação nos ajudam a responder a essa pergunta.

Correlação e Covariância

Seja uma amostra de dez pessoas adultas, do sexo masculino, e sejam a altura (cm) e o peso (kg) dessas pessoas denotadas por X e Y, respectivamente. Para cada elemento da amostra, temos um par ordenado (x, y). Teremos então n = 10 pares de valores das duas variáveis, que poderão ser representadas em um diagrama cartesiano bidimensional denominado diagrama de dispersão.

Tabela Pessoa Altura (cm) Peso (kg)

1 174 74 2 161 68 3 171 63 4 181 92 5 182 80 6 165 73 7 155 61 8 168 64 9 176 90 10 175 81

Suponha que tenham sido obtidos os valores apresentados na tabela acima. O diagrama de dispersão correspondente é o da próxima figura. A vantagem do diagrama de dispersão está em que, muitas vezes, sua simples observação já nos dá uma boa ideia de como as duas variáveis se correlacionam, isto é, qual a tendência de variação conjunta que apresentam.

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 14

Page 15: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Observando o diagrama de dispersão acima com atenção, constatamos que existe, para maiores valores de X (altura), uma tendência a obter maiores valores de Y (peso) e vice-versa. Quando isso ocorre, diz-se que há correlação linear positiva entre X e Y.

Entretanto, também podemos ter casos em que o diagrama de dispersão apresenta o aspecto da figura que se segue, indicando que, para maiores valores de X, a tendência é observarem-se menores valores de Y e vice-versa. Diz-se que nesse caso a correlação é negativa. Por exemplo, a renda per capita de países e o índice de analfabetismo são variáveis negativamente correlacionadas.

É claro que também pode ocorrer o caso em que as variáveis são não correlacionadas. Neste caso, o aspecto do diagrama de dispersão é o da próxima figura.

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 15

Page 16: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Vimos que o sinal da correlação indica a tendência da variação conjunta das duas variáveis. Além disso, devemos considerar também a intensidade ou o grau da correlação. A correlação linear (em valor absoluto) entre X e Y na figura em que a correlação é negativa é mais intensa do que a da figura em que a correlação é positiva, pois os pontos da primeira apresentam uma tendência mais acentuada de se colocarem segundo uma reta do que os da última.

Sejam X e Y variáveis aleatórias. Então a covariância de X e Y é definida por

(1)

em que

Se X e Y são variáveis aleatórias discretas e é sua função de probabilidade conjunta, a covariância entre X e Y é dada por

(2)

Caso X e Y sejam variáveis aleatórias contínuas com função densidade de probabilidade conjunta f(x,y), a covariância é calculada pela integral

(3)

A covariância mede a intensidade da correlação linear existente entre duas variáveis. Além disso, ela também nos dá o sinal da correlação, se positivo ou negativo. Suponha que tenhamos uma amostra de n pares ordenados (x,y). Neste caso, a covariância pode ser estimada pela estatística Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 16

Page 17: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

em que sxy é a covariância amostral de X e Y (4), sx é o desvio-padrão

amostral de X

(7)

desvio-padrão amostral de Y

(8)

Substituindo (4), (7) e (8) em (6), obtemos

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 17

Observe que a covariância depende das unidades de medida das variáveis X e Y. Percebe-se mais claramente o significado da covariação dividindo-se a covariância entre X e Y por seus respectivos desvios-padrão. Define-se a razão resultante como a correlação entre as variáveis aleatórias X e Y, denotada pela letra grega

(5)

em que denotam os desvios-padrão de X e Y, respectivamente.

A correlação é estimada pela estatística denominada coeficiente de correlação linear de Pearson, coeficiente de ou, simplesmente,

definido por correlação,

(6)

Page 18: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 18

(9)

em que

e

A representação abreviada dos somatórios de (9) por meio de

é útil e importante para a prova. Não é difícil mostrar que

Sxy = n.covariância amostrai

Sxx = n.variância amostral de X

Syy = n.variância amostral de Y

Sxy = "soma dos produtos entre X

e Y" ou simplesmente "soma dos produtos"

Sxx = "soma dos quadrados de X"

Syy = "soma dos quadrados de Y"

(10)

(11)

(12)

As fórmulas (10), (11) e (12) devem ser memorizadas porque são importantes para a prova.

O coeficiente de correlação tem as importantes propriedades de ser adimensional e de variar entre -1 e +1 , o que não ocorre com a covariância. A vantagem de ser adimensional está no fato de seu valor não ser afetado pelas unidades adotadas. Por outro lado, o fato de se ter com que um dado valor de R seja facilmente interpretado. Note que R = -1 corresponde ao caso de correlação linear negativa perfeita e R = +1 corresponde ao caso de correlação linear positiva perfeita.

Page 19: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior Ressaltamos que ; i correlação nula, isto é, p = 0, significa que não há associação linear entre X e Y. Mesmo que X e Y tenham covariância zero, elas podem ter uma associação não linear, como em uma circunferência centrada em (0,0) e de raio 1).

(equação de

Uma importante consequência da independência estatística é a seguinte:

- se X e Y são variáveis aleatórias independentes, então a covariância e a correlação entre elas é nula (memorize para a prova!).

GABARITO: B

6. (Fiscal de Rendas-MS/2006/FGV) Analise as afirmativas a seguir, a respeito de duas variáveis aleatórias X e Y:

I. se X e Y são independentes, então Cov(X,Y) = 0; II. se Cov(X,Y) = 0, então X e Y são independentes; III. se X e Y são independentes, então E(XY) = E(X).E(Y); IV. se E(XY) = E(X).E(Y), então X e Y são independentes.

Assinale:

(A) se nenhuma afirmativa estiver correta.

(B) se somente as afirmativas I e III estiverem corretas.

(C) se somente as afirmativas I e IV estiverem corretas.

(D) se somente as afirmativas II e IV estiverem corretas.

(E) se todas as afirmativas estiverem corretas.

Resolução

Sejam X e Y variáveis aleatórias. Então a covariância de X e Y é definida como

Se X e Y são variáveis aleatórias independentes, então a covariância entre elas é nula (o que indica que não há associação linear entre elas!), ou seja,

Cov(X,Y) = 0 (p/ X e Y independentes)

Diz-se que X e Y são não correlacionadas quando Cov(X,Y) = 0.

se X e Y são não correlacionadas não A relação recíproca não é verdadeira: podemos afirmar que X e Y sejam independentes. Porém, a não correlação entre X e Y implica independência estatística somente

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 19

Page 20: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

A variável (X,Y) tem distribuição normal bidimensional se sua densidade conjunta for dada por

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 20

quando X e Y têm distribuição conjunta normal, ou seja, quando têm distribuição normal bidimensional, a qual será apresentada mais adiante, após a análise das afirmativas.

Análise das afirmativas:

I. "se X e Y são independentes, então Cov(X,Y) definição.

Verdadeira, por

II. "se Cov(X,Y) = 0, então X e Y são independentes" Falsa, pois a relação recíproca não é verdadeira: se X e Y são não correlacionadas não podemos afirmar que X e Y sejam independentes.

III. "se X e Y são independentes, então E(XY) = E(X).E(Y)" Verdadeira, pois Cov(X,Y) = 0 implica E(XY) = E(X).E(Y).

IV. "se E(XY) = E(X).E(Y), então X e Y são independentes" correlação não implica independência.

Falsa, pois a não

COMENTÁRIOS ADICIONAIS

Distribuição Normal Bidimensional

A distribuição normal bivariada ou bidimensional é um modelo importante para variáveis aleatórias contínuas bidimensionais.

Page 21: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

A normal bidimensional possui as seguintes propriedades:

(a) As distribuições marginais de X e Y são normais

Se X e Y são conjuntamente normais e não correlacionadas (p=0), podemos escrever a densidade conjunta como

Atenção: a não correlação entre X e Y implica independência estatística somente quando X e Y são variáveis aleatórias conjuntamente

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 21

unidimensionais:

(b) As distribuições condicionais são normais, com

ou seja, a densidade conjunta é o produto das duas marginais, que são normais. Isto quer dizer que X e Y são independentes no caso em que X e Y tiverem densidade conjunta normal com p=0 (memorize para a prova!)

Page 22: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

GABARITO: B

Resolução

A média condicional

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 22

normais. Isto não é verdade quando X e Y tem distribuição conjunta diferente da normal bidimensional.

é uma função linear de y, ou seja E(X|y) = g(y). Desta forma, E(X|Y=y) é a regressão de X em Y e isso implica que as opções A e B poderiam ser descartadas logo de início, pois ambas são funções da variável x.

A opção D contém a expressão correta.

GABARITO: D

8. (Analista da SUSEP/Atuária/2010/ESAF) A partir de uma amostra foram obtidas as estatísticas:

Qual a reta de regressão estimada de Y em X?

Page 23: Raciocínio Lógico - Aula 09

Ou seja, b pode ser calculado, de forma alternativa, pela razão entre a covariância amostral Sxy (estamos usando uma notação diferente da do

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 23

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Resolução

A reta a estimar é

em que o parâmetro b (estimativa da declividade) é dado por

e o parâmetro a (estimativa do intercepto) por

Observe que estamos usando uma notação diferente do enunciado: a quantidade Sxy definida acima não é a covariância entre X e Y.

Vimos que

sxy = Sxy / n (covariância amostral = soma dos produtos - n)

e que

sx = Sxx /n (variância amostral de X = soma dos quadrados de X - n)

Logo, se dividirmos o numerador e o denominador da fórmula de b dada acima por n, poderemos reescrevê-la da seguinte maneira:

b = covariância amostral - variância amostral de X

Page 24: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

REVISÃO DA NOÇÃO DE REGRESSÃO LINEAR SIMPLES

Seja Y a variável dependente e X a variável suposta sem erro, ou seja, não aleatória. A regressão linear simples pressupõe que seja adotado o modelo

toda a variação explicada de Y fique em torno da reta de regressão. Isso implica que a reta de regressão fornece a média de Y para cada valor de x considerado.

Uma outra suposição básica que pode ser adotada é a de que a variação residual da variável Y seja independente de x. Ou seja, usualmente admite-se que a variação de Y em torno da linha teórica de regressão pode ser descrita por um desvio padrão residual que independe do ponto em consideração.

Por fim, admitiremos que a variação de Y em torno da linha teórica de regressão se dê segundo distribuições normais independentes, para qualquer valor de x; o que implica dizer que as variações residuais em relação à reta de regressão são independentes e normalmente distribuídas2

(vide figura a seguir).

2 Os professores estão cientes do fato de que os resíduos do modelo ajustado nem sempre seguem uma distribuição normal. Contudo, o importante é ter em mente que as variações residuais em relação à reta de regressão são independentes e normalmente distribuídas por hipótese. Isto não implica dizer que os resíduos, de fato, sejam normalmente distribuídos. Acredite: há muitos dados empíricos que violam a hipótese de normalidade! Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 24

enunciado, mas que está coerente com a vista no texto!) e a variância

. Logo,

e

Deste modo, a reta de regressão estimada de Y em X é

(1)

em que é o intercepto, é a declividade e denota a componente aleatória

da variação de Y ( é uma variável aleatória).

É razoável supor que a variável aleatória tenha média nula, a fim de que

Page 25: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Suponhamos que a reta estimativa de (1) seja

denota os valores dados pela reta estimativa,

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 25

(2)

o ajuste pode ser feito pelo método dos mínimos quadrados, segundo o qual a reta a ser adotada deverá ser aquela que torna mínima a soma dos quadrados das distâncias da reta aos pontos

Por outro lado,

experimentais i em que a distância é igual ao erro aleatório no ponto em consideração como ilustrado pela próxima figura). Ou seja, devemos procurar

a reta para a qual se consiga minimizar A ideia central desse

procedimento é simplesmente a de minimizar a variação residual em torno da reta estimativa.

é a estimativa do em que

parâmetro estimativa do parâmetro

também denominado coeficiente de regressão linear, é a

Existem diversos métodos de estimação da reta de regressão. Podemos até mesmo estimar a reta visualmente. O método de ajuste visual consiste em traçar diretamente a reta, com auxílio de uma régua, no diagrama de dispersão, procurando fazer, da melhor forma possível, com que essa reta passe por entre os pontos. Esse procedimento, por ser subjetivo, somente será razoável se a correlação linear for muito forte, caso contrário levará a resultados pobres.

Page 26: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Tendo em vista a expressão (2), devemos, portanto, impor a condição

as quais fornecem o seguinte sistema de duas equações a duas incógnitas:

(7)

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 26

De acordo com o Cálculo, os parâmetros a e b que minimizam (3) serão aqueles que anulam as derivadas parciais de (3)

(3)

(4)

Não é difícil chegar às expressões

(5)

(6)

Page 27: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior Os pontos (x,y) fornecem os elementos para a montagem de (7), cuja solução forneceria os coeficientes a e b. Entretanto, é mais fácil considerar de uma vez a solução analítica do sistema, segundo a qual

(8)

GABARITO: C

9. (Técnico de Defesa Aérea e Controle de Tráfego Aéreo/Estatística/2009/CESGRANRIO) Um pesquisador estudou a relação entre o tempo, medido em segundos, que um inspetor leva para reagir a um estímulo visual (Y) e a idade (X), medida em anos completos. Os dados de 25 inspetores foram coletados e obtidas as seguintes informações:

As estimativas dos mínimos quadrados, para o coeficiente linear e a inclinação da reta, respectivamente, são:

(A) 80 e 3,25

(B) 50 e 2,85

(C) 30 e 2,50

(D) 20 e 4,0

(E) 10 e 3,62

Resolução

O modelo de regressão linear simples é

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 27

Pede-se os valores de a e b, respectivamente.

Page 28: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Logo,

em que b é a inclinação da reta ajustada. Como a única opção em que a inclinação é 2,50 é o item (C), na prova já marcaríamos essa opção sem continuar os cálculos.

Não obstante, calcularemos o coeficiente linear (ou intercepto)

Assim, encontramos a reta ajustada y = 30 + 2,5x.

GABARITO: C

10. (ICMS-SP/2009/FCC) O gráfico abaixo demonstra a evolução da receita tributária anual no estado de São Paulo desde 1999, com os valores arrecadados em bilhões de reais.

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 28

Page 29: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior dos mínimos quadrados, com base nas observações de 1999 a 2008, obteve-se

A previsão da receita tributária para 2009, em bilhões de reais, em função da equação obtida pelo método dos mínimos quadrados é igual a

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 29

para a estimativa de

Resolução

Logo,

GABARITO: B

11. (APOFP-SP/2009/ESAF) Uma amostra aleatória simples (X1,Y0, (X2,Y2), ..., (Xn,Yn) de duas variáveis aleatórias X e Y forneceu as seguintes quantidades:

Page 30: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 30

Calcule o valor mais próximo do coeficiente de determinação da regressão linear de Y em X.

(A) 0,85

(B) 0,83

(C) 0,80

(D) 0,88

(E) 0,92

Resolução

PRELIMINARES

O Coeficiente de Determinação R2

Considere as equações

reta estimativa da regressão linear simples

estimativas da declividade (b) e do intercepto (a)

e

Então podemos escrever que

Usando as fórmulas das somas

obtemos

e a fórmula do coeficiente b,

(2)

(1)

Se considerarmos a média de todos os valores yi e tomarmos as diferenças

entre os valores teremos

Page 31: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Considerando as diferenças residuais, podemos escrever

Distribuindo o somatório acima e usando a fórmula de a, chega-se à expressão

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 31

em que a soma de quadrados é calculada com base nos desvios

da reta de mínimos quadrados em relação à horizontal

figura a seguir.

como ilustrado pela

Substituindo

(4)

(3)

Page 32: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

É usual escrever (4) usando a notação

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 32

(5)

em que

SQT = SQE + SQR,

soma dos quadrados total (variação total),

soma dos quadrados dos erros (variação

soma dos quadrados da regressão (variação

residual) e

explicada).

variação total = variação residual +variação explicada

A soma de quadrados SQT mede a variação total de Y independentemente de X, a soma de quadrados SQE mede a variação residual e a soma de quadrados SQR mede o desvio da reta de mínimos quadrados em relação à média (é a variação "explicada" pela reta de regressão).

Dividindo ambos os membros da equação (5) por SQT, temos

(6)

Podemos querer saber quanto representa proporcionalmente a parcela da variação total de Y que é explicada pela reta de regressão, ou seja, quanto vale a razão SQR/SQT. Utilizando (2), podemos escrever

(7)

Substituindo em (7) obtemos

(8)

ou

Page 33: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

(9)

Temos que

Logo,

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 33

A fórmula (8) mostra que o coeficiente R2 de uma regressão linear simples exprime a porcentagem da variação total de Y (SQT) que é explicada pela reta de regressão ajustada. coeficiente de Essa grandeza é chamada determinação 1-R2 é o coeficiente de indeterminação). O R2 quantifica o grau de ajuste de um conjunto de dados à reta de regressão estimada. Quanto mais próximo de 1 estiver R2 melhor terá sido nosso trabalho para explicar a variação em y, com e maior será a capacidade de

previsão de nosso modelo sobre todas as observações amostrais.

Observe que o coeficiente de determinação é igual ao quadrado do coeficiente de correlação linear de Pearson R. adimensional).

No caso de ajuste perfeito, temos R2 = 1, e não há variação residual, pois todos os pontos estão alinhados. Se, por exemplo, R = ±0,7, teremos um coeficiente de determinação igual a 0,49, significando que a reta de regressão não consegue explicar nem mesmo a metade da variação de Y. Para a reta de regressão explicará mais de 80% da variação total de Y.

Voltemos à resolução.

Apreendemos que

O valor mais próximo é 0,80 (C).

Page 34: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior GABARITO: C

12. (ICMS-SP/2006/FCC) Em um determinado país, deseja-se determinar a relação entre a renda disponível (Y), em bilhões de dólares, e o consumo (C),

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 34

também em bilhões de dólares. Foi utilizado o modelo linear simples

em que Ci é o consumo no ano i, Yi é o valor da renda disponível no

o erro aleatório com as respectivas hipóteses para a regressão linear àão parâmetros desconhecidos, cujas estimativas foram obtidas

através do método dos mínimos quadrados. Para obtenção desta relação considerou-se ainda as seguintes informações colhidas através da observação nos últimos 10 anos:

Para o cálculo do coeficiente de correlação de Pearson (R), usou-se a fórmula:

em que Cov(Y,C) é a covariância de Y e C, DP(Y) é o desvio-

padrão de Y e DP(C) é o desvio-padrão de C.

Então,

(A) o coeficiente de explicação (R2) correspondente é igual a 64%.

(B) utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que, em um ano, caso a renda disponível seja igual a 15 bilhões de dólares, o consumo será igual a 13 bilhões de dólares.

(C) obtendo para um determinado ano uma previsão para o consumo de 10 bilhões de dólares, significa que a renda disponível considerada foi de 12,5 bilhões de dólares.

(D) o valor da estimativa encontrado para o parâmetro

(E) o valor da estimativa encontrado para o parâmetro

Resolução

Atenção: a variável independente é Y (renda disponível) e a dependente é C (consumo).

Seja um conjunto de n pares ordenados variáveis Y e C. Vimos que

Page 35: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Essa quantidade é denominada coeficiente de correlação quando Y e C são tratadas como variáveis aleatórias. O quadrado da mesma quantidade é chamado coeficiente de determinação. No contexto da regressão linear simples, uma das variáveis é considerada determinística ou não estocástica (na questão, a variável independente ou explicativa é Y) e a outra (a variável dependente C) é considerada aleatória.

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 35

O problema da regressão consiste em determinar a relação funcional entre as variáveis dependente e explicativa.

A função de regressão C = a + by nos dá o valor médio de uma das variáveis

(C) em função do valor observado da outra (y) , isto é, E[C|y] = C.

Análise das alternativas:

Logo,

VERDADEIRA

(C) FALSA (vide item B).

(D) FALSA (vide item B).

Page 36: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior (E) FALSA (vide item B).

GABARITO: B

13. (ICMS-RJ/2008/FGV) Sejam X e Y duas variáveis aleatórias quaisquer. Então:

A) VAR(X-Y) = VAR(X) - VAR(Y)

B) VAR(X-Y) = VAR(X) + VAR(Y) - COV(X,Y)

C) VAR(X-Y) = VAR(X) + VAR(Y) - 2COV(X,Y)

D) VAR(X-Y) = VAR(X) + VAR(Y) + COV(X,Y)

E) VAR(X-Y) = VAR(X) + VAR(Y) + 2COV(X,Y)

Resolução

Sejam a e b constantes. Então

VAR(aX + bY) = a2VAR(X) + b2VAR(Y) + 2abCOV(X,Y).

Nesta questão, a =1 e b = -1. Logo,

VAR(X-Y) = VAR(X) + VAR(Y) - 2COV(X,Y).

Obs.: leia a revisão de conceitos a seguir caso você não tenha entendido a resolução deste exercício.

REVISÃO: MÉDIA E VARIÂNCIA DE UMA COMBINAÇÃO LINEAR DE VARIÁVEIS ALEATÓRIAS

Sejam X e Y variáveis aleatórias e Z=g(X,Y) uma função dessas variáveis. Vamos admitir que essa função tenha a forma

(1) Z = aX + bY

em que a e b são constantes. Essa expressão é uma combinação linear (ou soma ponderada). A esperança de (1) é dada por

1. Se X, Y e Z são variáveis aleatórias e a, b e c são constantes, então Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 36

(2)

A Eq. (2) nos diz que o valor esperado de uma combinação linear de duas variáveis aleatórias é a combinação linear de seus respectivos valores esperados. Essa regra pode ser generalizada para um número arbitrário de variáveis aleatórias, quer elas sejam discretas ou continuas.

As seguintes regras relativas à variância são válidas:

Page 37: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 37

(3)

Note que

2. Se X, Y e Z são independentes ou não correlacionadas

Se fizermos obtemos

A expressão (5) nos diz que

As regras sobre a variância de três variáveis aleatórias podem ser generalizadas para n variáveis aleatórias.

GABARITO: C

14. (Analista Técnico da SUSEP/2006/ESAF) Sendo X uma v. a. d. -variável aleatória discreta e sendo Y = aX + b, pode concluir-se que var (aX + b) é igual a:

Resolução

Var(aX + b) = a2 Var(X)

GABARITO: D

15. (AFRF/2005/ESAF) Para uma amostra de dez casais residentes em um mesmo bairro, registram-se os seguintes salários mensais (em salários mínimos):

(4)

(5)

• W • • • • f m m a J m

a variância da soma de variáveis aleatórias independentes é igual à soma das variâncias (memorize para a prova!).

Page 38: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior Identificação do casal 1 2 3 4 5 6 7 8 9 10 Salário do marido (Y) 30 25 18 15 20 20 21 20 25 27 Salário da esposa (X) 20 25 12 10 10 20 18 15 18 13

Sabe-se que:

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 38

Assinale a opção cujo valor corresponda à correlação entre os salários dos homens e os salários das mulheres.

A) 0,72

B) 0,75

C) 0,68

D) 0,81

E) 0,78

Resolução

Logo,

GABARITO: B

16. (Analista do BACEN/Área 3/2006/FCC) Sejam X e Y duas variáveis aleatórias e

Page 39: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior I. E(X) e E(Y) as expectâncias de X e Y, respectivamente;

II. Var(X) e Var(Y) as variâncias de X e Y, respectivamente;

III. Cov(X,Y) a covariância de X e Y.

Tem-se, em qualquer situação,

A) E(X).E(Y) = E(XY) - Cov(X,Y)

B) Cov(X,Y) = Var(X).Var(Y)

C) E(2X+5) = 4E(X)

D) Se E(XY) = E(X).E(Y), então X e Y são independentes.

E) Var(X+10) = Var(X) + 10

Resolução

Sabemos que

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 39

em que Portanto, a alternativa correta é a (A).

A alternativa (B) está errada porque não está de acordo com a definição de covariância.

A alternativa (C) não é verdadeira, pois E(2X+5) = 2E(X) + 5.

A alternativa (D) é incorreta porque E(XY) = E(X).E(Y) (variáveis X e Y não correlacionadas) não implica independência (mas a recíproca é verdadeira, ou seja, independência implica a não correlação).

A alternativa (E) é falsa porque Var(X+10) = Var(X).

GABARITO: A

17. (AFRF/2009/ESAF) Na análise de regressão linear simples, as

obtidas pelo método de Mínimos Quadrados. Nesse caso, os valores dessas estimativas são obtidos através de uma amostra

Yi com (i =1, 2, ...,n) pode-se estabelecer o desvio ou resíduo - aqui denotado

por e-t - entre a reta de regressão Y-, e sua estimativa Y i . Sabe-se que o

Método de Mínimos Quadrados consiste em adotar como estimativas dos

Page 40: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Y 1 3 9

2 1/8 1/24 1/12 X 4 1/4 1/4 0

6 1/8 1/24 1/12

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 40

os valores que minimizam a soma dos quadrados dos desvios

Desse modo, o Método de Mínimos Quadrados consiste em minimizar a expressão dada por:

Resolução

A questão forneceu todas as informações necessárias para a resolução.

Pelo Método dos Mínimos Quadrados temos que minimizar a soma dos quadrados das diferenças entre os valores de Y-t e as respectivas estimativas

por meio da reta de regressão. Logo teríamos:

Logo alternativa correta é a "B". O gabarito oficial preliminar indicou a alternativa "A", mas está errado.

GABARITO: B

O enunciado a seguir refere-se às questões de números 18 e 19.

A função densidade de probabilidade conjunta de duas variáveis aleatórias discretas é dada pela tabela a seguir:

Page 41: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior 18. A covariância entre X e Y é

A) 1

B) 3

C) 4

D) 12

E) 0

Resolução

A covariância entre as variáveis aleatórias discretas X e Y é dada pela expressão

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 41

Antes, é preciso calcular os valores das médias

em que gx(x) é a função de probabilidade marginal de X,

dada por

é a função de probabilidade marginal de Y,

dada por

Agora já podemos calcular a covariância, pois temos os valores de Sendo assim,

Page 42: Raciocínio Lógico - Aula 09

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 42

Cov(X, Y) = 1/2 + 0 -1 + 0 + 0 + 0 - 1 / 2 + 0 +1 = 0

Logo, X e Y são variáveis não correlacionadas.

Você também chegaria ao mesmo resultado se usasse a fórmula equivalente

Confirme você mesmo que E[XY ] = 12. Portanto,

Cov(X, Y) = 12 - 4 x 3 = 0

GABARITO: E

19. Assinale a alternativa correta.

A) X e Y não são independentes.

B) X e Y são independentes.

C) X e Y são correlacionadas.

D) X e Y têm distribuição conjuntamente normal.

E) X e Y têm distribuições marginais normais.

Resolução

Análise das alternativas:

(A) Se X e Y são independentes, deve valer

f(xi, yd) = gX (xi) x hY (yd) para quaisquer valores de X e Y.

Entretanto, observe que

Logo, X e Y não são independentes, apesar de serem não correlacionadas ^ alternativa CORRETA.

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Page 43: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior (B) Alternativa INCORRETA, haja vista o explicado acima.

(C) Alternativa INCORRETA, pois X e Y são não correlacionadas.

(D) Nada se pode afirmar sobre a distribuição conjunta de X e Y ^ alternativa INCORRETA.

(E) Nada se pode afirmar sobre as distribuições marginais de X e Y ^ alternativa INCORRETA.

GABARITO: A

O enunciado a seguir refere-se às questões de números 20 e 21.

Considere as variáveis aleatórias independentes Xl3X2,...,Xn. Suponha que

essas n variáveis possuam a mesma distribuição de probabilidades com média ^ e variância a2. Seja

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 43

20. Podemos afirmar que o valor esperado de

Resolução

GABARITO: C

21. Podemos afirmar que a variância de

Page 44: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Observação: os resultados obtidos são conseqüência da Lei (fraca) dos Grandes Números. Por exemplo, assuma que você tenha registrado o

desejadas para qualquer estimador (este assunto será visto em aula posterior).

GABARITO: B

22. (Analista do BACEN/Área 3/2006/FCC) Uma empresa, com a finalidade de determinar a relação entre os gastos anuais com propaganda (X), em R$ 1 000,00, e o lucro bruto anual (Y), em R$1.000,00, optou por utilizar o

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 44

Resolução

As duas questões mostram que o estimador é não viesado

Considerou, para o estudo, as seguintes informações referentes às observações nos últimos 10 anos da empresa:

conjunto de observações de uma variável aleatória X com média

(desconhecida) e variância também desconhecida). Suponha que n seja

um número suficientemente grande. Então a média

média amostral

pode ser estimada pela

Page 45: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que, caso haja um gasto anual com propaganda de 80 mil reais, a previsão do lucro bruto anual, em mil reais, será de

A) 84

B) 102,5

C) 121

D) 128,4

E) 158

Resolução

A equação da reta de mínimos quadrados é

Substituindo o valor x = 80 na equação acima obtemos

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 45

Fazendo os cálculos, temos que

Logo,

Page 46: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

A) 0

B) 2,5

C) 1,25

D) 0,88

E) 0,63

GABARITO: D

24. (ICMS-RJ/2008/FGV) Sejam X, Y e Z três variáveis com correlações de Pearson expressas pela matriz abaixo:

X Y Z X 1,000 Y 0,800 1,000 Z 0,000 -0,500 1,000

Pode-se, então, afirmar que:

A) X e Z são independentes.

B) a correlação parcial entre X e Y, após a correção para Z, é negativa.

C) o coeficiente de determinação da regressão de Y em X é maior do que 60%.

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 46

GABARITO: B

23. (INÉDITA) Considere os dados da questão 22. O coeficiente de correlação é de

Resolução

D) a correlação entre é negativa.

Page 47: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior E) a covariância entre X e Y é igual a 0,64.

Resolução

Análise das alternativas:

(A) "X e Z são independentes."

A tabela indica que X e Z são não correlacionadas, pois RXZ = 0. Contudo, a não correlação não implica independência ^ alternativa INCORRETA.

(B) "a correlação parcial entre X e Y, após a correção para Z, é negativa."

A tabela indica que a correlação ente X e Y é igual a 0,8 (positiva) ^ alternativa INCORRETA.

(C) "o coeficiente de determinação da regressão de Y em X é maior do que 60%."

A tabela indica que a correlação ente X e Y é R = 0,8. Logo o coeficiente de determinação é R2 = 0,82 = 0,64 = 64% (maior do que 60%) ^ alternativa CORRETA.

(E) "a covariância entre X e Y é igual a 0,64."

Aprendemos que R = sxy /(sxsy), em que sxy é a covariância amostral entre X e

Y, sx denota o desvio-padrão amostral de X e sy denota o desvio-padrão amostral de Y. Como não foram dados os valores de sx e de sy, nada se pode afirmar sobre o valor da covariância entre X e Y ^ alternativa INCORRETA.

GABARITO: C

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 47

d<0 é negativa."

Note que V e W são funções lineares de X e Z, respectivamente. Se a correlação entre X e Z é nula, então a correlação entre V e W também é nula ^ alternativa INCORRETA.

Page 48: Raciocínio Lógico - Aula 09

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 48

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Assinale:

A) se somente a afirmativa I for verdadeira.

B) se somente as afirmativas I e II forem verdadeiras.

C) se somente as afirmativas I e III forem verdadeiras.

D) se somente as afirmativas II e II forem verdadeiras.

E) se todas as afirmativas forem verdadeiras.

Resolução

Análise das afirmativas:

(I) VERDADEIRA, pois a2 = 10a1, conforme demonstrado acima.

(II) FALSA, dado que b2 = 10b! +100 .

(III) Dados:

- aplicação da transformação linear ^ = 10y + 100 resulta no coeficiente de

Vimos que a correlação amostral R é dada por

Então,

Page 49: Raciocínio Lógico - Aula 09

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 49

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

e

Conclui-se que a transformação linear Y' = 10Y + 100 não altera a qualidade da regressão original

Portanto, a assertiva (III) é VERDADEIRA.

(*) Esta propriedade é válida para qualquer transformação que seja linear.

GABARITO: C

para os demais valores de x. Suponha que X1 e X2 sejam variáveis aleatórias independentes, cada uma delas com a função densidade de probabilidade f(x). Então podemos afirmar que a função densidade de probabilidade conjunta f(x1,x2) é

Page 50: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Resolução

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 50

Logo,

GABARITO: D

27. (Fiscal de Rendas do Município do RJ/2010/ESAF) A partir de uma amostra aleatória simples formada por 22 observações das variáveis X e Y calculou-se

Obtenha a reta de regressão linear de Y em X.

Resolução

Modelo de regressão linear simples:

denota a componente aleatória é o intercepto,

da variação de Y (s é uma variável aleatória).

é a estimativa do denota os valores dados pela reta estimativa, é a estimativa do parâmetro

para os demais valores de xj.

caso contrário.

Page 51: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 51

Dados:

- cov. amostral

- (desvio padrão amostral de X)2

- média de Y =

- média de X =

Logo,

Reta estimativa: (opção E).

GABARITO: E

28. (Fiscal de Rendas do Município do RJ/2010/ESAF) Com os dados da questão anterior, calcule o valor mais próximo do coeficiente de determinação R2 da regressão linear de X em Y.

A) 0,65

B) 0,81

C) 0,85

D) 0,91

E) 0,88

Resolução

Nunca podemos esquecer os conceitos fundamentais. Lembre que a correlação entre as variáveis aleatórias X e Y, denotada por p(X,Y), é dada por:

Page 52: Raciocínio Lógico - Aula 09

NOTA: não confunda correlação amostral R com correlação p(X,Y)! A primeira é uma estimativa da segunda. A correlação é um momento estatístico. Só conseguimos calcular a correlação p(X,Y) quando conhecemos a distribuição conjunta de probabilidade de X e Y, ou seja, quando sabemos quem é a função f(X,Y).

GABARITO: C

29. (ICMS-RJ/2011/FGV) A tabela abaixo mostra os valores de duas variáveis, X e Y.

X Y 4 4,5 4 5 3 5 2 5,5

Sabe-se que

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

= covariância/(desvio padrão de X . desvio padrão de Y)

O módulo da correlação sempre é menor ou igual a

A correlação amostral ou coeficiente de correlação linear de Pearson

(R) é o estimador da correlação p(X,Y), sendo dada por:

R = cov. amostral/(desv. padrão amostral de X . desv. padrão amostral de Y)

ou

52 Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br

Page 53: Raciocínio Lógico - Aula 09

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 53

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

O valor de b na regressão simples Y = a + bX é

A) 11/5

B) -3/8

C) -4/11

D) -4/17

E) -11/65

Resolução

O valor de b na regressão simples é dado por

Lembre que

A tabela tem n = 4 pares de dados (X,Y). Agora podemos efetuar as contas:

Page 54: Raciocínio Lógico - Aula 09

A) se apenas as afirmativas I e II estiverem corretas.

B) se apenas as afirmativas I e III estiverem corretas.

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 54

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior GABARITO: C

30. (ICMS-RJ/2011/FGV) Para duas variáveis populacionais, X e Y, o desvio-padrão de X é 40, o desvio-padrão de Y é 20 e a covariância entre Y e X é -100. Assim, o coeficiente de correlação entre X e Y é

A) -0,5.

B) 2

C) -0,25

D) -0,125

E) 0,125

Resolução

Questão imediata. Sabemos que

GABARITO: D

31. (Economista-CODEBA/2010/FGV) Sejam

aleatórias para uma amostra de tamanho N.

Defina a Média amostral

avalie as afirmativas abaixo:

I. O valor esperado da média amostral

II. A variância da média amostral é

III. O valor esperado de

Assinale

Page 55: Raciocínio Lógico - Aula 09

afirmativa III está correta.

(*) Entendemos que o enunciado não é preciso, haja vista que as observações de uma amostra nem sempre são independentes. Por exemplo, isso ocorre em algumas séries financeiras do mundo real, em que as amostras podem apresentar um alto grau de correlação.

GABARITO: D

Exercícios de Revisão

(AFTM-SP/2007/FCC/Adaptada) Instruções: para responder à próxima questão, utilize, dentre as informações abaixo, as que julgar adequadas. Se Z tem distribuição normal padrão, então:

P(0< Z < 1) = 0,341, P(0< Z < 1,6) = 0,445, P(0< Z < 2) = 0,477

32. Os depósitos efetuados no Banco B, num determinado mês, têm distribuição normal com média R$ 9.000,00 e desvio padrão R$ 1.500,00. Um

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 55

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior C) se apenas as afirmativas II e III estiverem corretas.

D) se todas as afirmativas estiverem corretas.

E) se nenhuma das afirmativas estiver correta.

Resolução

Apesar de o enunciado ter sido omisso quanto à independência das variáveis aleatórias X13 X 2, X 3,..., XN , é razoável assumir que elas sejam independentes

(*).

Vimos que

afirmativa I está correta.

afirmativa II está correta.

Além disso,

Page 56: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior depósito é selecionado ao acaso dentre todos os referentes ao mês em questão. A probabilidade de que o depósito exceda R$ 6.000,00 é de

A) 97,7%

B) 94,5%

C) 68,2%

D) 47,7%

E) 34,1%

Resolução

Dados: X é uma variável aleatória normal com

Normal padrão:

P(Z > -2,0) = P(Z < 2,0) = 0,5 + P(0,0 < Z < 2,0) = 0,5 + 0,477 = 0,977 = 97,7%

GABARITO: A

33. (AFTE-RS/2009/Fundatec) Seja X uma variável aleatória contínua, com

A) 0,5

B) 0

C) 2/3

D) 1

E) 1/3

Resolução

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 56

Page 57: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

O gráfico da figura acima ilustra a forma da função densidade de probabilidade de X, denotada por f(x). Como f(x) é simétrica em relação a zero, temos que a média de X é zero (opção B). Repare que resolvemos a questão sem fazer nenhuma conta! Bastou saber esboçar o gráfico de f(x).

Por completeza, calculemos o valor da constante "c". Sabemos que a área sob f(x) é unitária. Então,

2 x (área do triângulo retângulo delimitado por 0<x<1/c) = 1

2 x (base x altura)/2 = 1 base x altura = 1

GABARITO: B

34. (AFTE-RS/2009/Fundatec) Seja Z uma variável aleatória contínua normalmente distribuída com média zero e desvio padrão um. Seja

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 57

A figura a seguir mostra o gráfico de f(x).

Seja X uma variável aleatória contínua

normalmente distribuída com média 200 e desvio padrão 20, então P(180<X<240), é:

A) 0,9772

B) 0,8413

C) 0,3413

D) 0,8185

E) 0,4772

Resolução

Page 58: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior Dados: X1 = 180, X2 = 240, P(Z < - 1 ) = 0,1587 e P(Z > 2) = 0,0228.

Z1 = (180 - 200)/20 = -1

Z2 = (240 - 200)/20 = 2

Pede-se P(180<X<240) = P(-1<Z<2).

P(-1<Z<2) = P(-1<Z<0) + P(0<Z<2)

Mas P(-1<Z<0) = 0,5 - P(Z<-1) e P(0<Z<2) = 0,5 - P(Z>2). Logo,

P(-1<Z<2) = 0,5 - P(Z<-1) + 0,5 - P(Z>2) = 0,5 - 0,1587 + 0,5 - 0,0228 = 0,8185 (opção D).

GABARITO: D

Abraços e até a próxima aula.

Bons estudos!

Moraes Junior [email protected]

Alexandre Lima [email protected]

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 58

Page 59: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Questões Comentadas e Resolvidas Nesta Aula

1. (Analista da SUSEP/Atuária/2001/ESAF) Uma loja vende lavadoras e secadoras de roupa. A distribuicão conjunta do número N1 de secadoras e do número N2 de lavadoras vendidas num mesmo dia é dada na tabela abaixo. Assinale a opcão que dá a probabilidade de que a venda, num mesmo dia, de lavadoras seja igual à de secadoras.

N1 N2 0 1 2 3 0 0,25 0,13 0,04 0,02 1 0,15 0,11 0,02 0,01 2 0,08 0,06 0,05 0,02 3 0,01 0,01 0,01 0,03

(A) 0,54

(B) 0,50

(C) 0,49

(D) 0,44

(E) 0,19

Julgue os itens a seguir.

2. Seja a distribuição conjunta de X e Y

f(x,y) = e-x-y, x>0, y>0.

Então, a densidade marginal fX(x) é dada por

fx(x) = e-y, para x>0.

3. Sejam X e Y variáveis aleatórias discretas com a seguinte distribuição conjunta:

Y=1 Y=2 Y=3 X=0 0,27 0,16 0,01 X = 1 0,32 0,22 0,02

Então a tabela abaixo especifica a distribuição condicional de X dado que Y=1:

x 0 1 fX|Y(x y=1) 0,458 0,542

4. Considere a função de distribuição conjunta

f(x,y) = e-x-y, x>0, y>0.

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 59

Page 60: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Pode-se afirmar que X e Y são variáveis aleatórias independentes.

5. As variáveis aleatórias X e Y são independentes. Então é válida a expressão

(A) E[XY] = E[X 2]E[Y2]

(B) E[XY] = E[X]E[Y]

(C) E[XY ] = E[X]/ E[Y]

(D) E[XY] = Cov(X, Y)

(E) E[XY] = (E[X]E[Y])2

6. (Fiscal de Rendas-MS/2006/FGV) Analise as afirmativas a seguir, a respeito de duas variáveis aleatórias X e Y:

I. se X e Y são independentes, então Cov(X,Y) = 0; II. se Cov(X,Y) = 0, então X e Y são independentes; III. se X e Y são independentes, então E(XY) = E(X).E(Y); IV. se E(XY) = E(X).E(Y), então X e Y são independentes.

Assinale:

(A) se nenhuma afirmativa estiver correta.

(B) se somente as afirmativas I e III estiverem corretas.

(C) se somente as afirmativas I e IV estiverem corretas.

(D) se somente as afirmativas II e IV estiverem corretas.

(E) se todas as afirmativas estiverem corretas.

7. (Analista da SUSEP/Atuária/2010/ESAF). Y e X são variáveis aleatórias com distribuição normal conjunta com E(Y) = |jY, E(X) = jX, e Cov(Y,X) = paYaX, onde aY e Gx são os desvios padrões de Y e X, respectivamente, e p o coeficiente de correlação entre Y e X. Qual a expressão da regressão de X em Y, E(X|Y=y)?

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 60

8. (Analista da SUSEP/Atuária/2010/ESAF) A partir de uma amostra aleatória (X1,Y1), (X2,Y2),..., (X20,Y20) foram obtidas as estatísticas:

Page 61: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

As estimativas dos mínimos quadrados, para o coeficiente linear e a inclinação da reta, respectivamente, são:

(A) 80 e 3,25

(B) 50 e 2,85

(C) 30 e 2,50

(D) 20 e 4,0

(E) 10 e 3,62

10. (ICMS-SP/2009/FCC) O gráfico abaixo demonstra a evolução da receita tributária anual no estado de São Paulo desde 1999, com os valores arrecadados em bilhões de reais.

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 61

Qual a reta de regressão estimada de Y em X?

9. (Técnico de Defesa Aérea e Controle de Tráfego Aéreo/Estatística/2009/CESGRANRIO) Um pesquisador estudou a relação entre o tempo, medido em segundos, que um inspetor leva para reagir a um estímulo visual (Y) e a idade (X), medida em anos completos. Os dados de 25 inspetores foram coletados e obtidas as seguintes informações:

Page 62: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

(Fonte: Secretaria da Fazenda do Estado de São Paulo - Histórico da receita tributária)

Para estimar a receita tributária em um determinado ano com base no

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 62

comportamento sugerido pelo gráfico, adotou-se o modelo 1, 2, 3, ..., sendo Yt = ln(RTt), em que RTt é a receita tributária no ano (1998+t) em bilhões de reais e ln o logaritmo neperiano

parâmetros desconhecidos e o erro aleatório com as respectivas hipóteses consideradas para o modelo de regressão linear simples. Utilizando o método dos mínimos quadrados, com base nas observações de 1999 a 2008, obteve-se para a estimativa de valor de 0,12, sabendo-se que:

A previsão da receita tributária para 2009, em bilhões de reais, em função da equação obtida pelo método dos mínimos quadrados é igual a

11. (APOFP-SP/2009/ESAF) Uma amostra aleatória simples de duas variáveis aleatórias X e Y forneceu as seguintes

quantidades:

Page 63: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Calcule o valor mais próximo do coeficiente de determinação da regressão linear de Y em X.

(A) 0,85

(B) 0,83

(C) 0,80

(D) 0,88

(E) 0,92

12. (ICMS-SP/2006/FCC) Em um determinado país, deseja-se determinar a relação entre a renda disponível (Y), em bilhões de dólares, e o consumo (C),

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 63

também em bilhões de dólares. Foi utilizado o modelo linear simples

em que Ci é o consumo no ano i, Yi é o valor da renda disponível no

o erro aleatório com as respectivas hipóteses para a regressão linear simples. são parâmetros desconhecidos, cujas estimativas foram obtidas através do método dos mínimos quadrados. Para obtenção desta relação considerou-se ainda as seguintes informações colhidas através da observação nos últimos 10 anos:

Para o cálculo do coeficiente de correlação de Pearson (R), usou-se a fórmula:

em que Cov(Y, C) é a covariância de Y e C, DP(Y) é o desvio-

padrão de Y e DP(C) é o desvio-padrão de C.

Então,

(A) o coeficiente de explicação (R2) correspondente é igual a 64%.

(B) utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que, em um ano, caso a renda disponível seja igual a 15 bilhões de dólares, o consumo será igual a 13 bilhões de dólares.

(C) obtendo para um determinado ano uma previsão para o consumo de 10 bilhões de dólares, significa que a renda disponível considerada foi de 12,5 bilhões de dólares.

(D) o valor da estimativa encontrado para o parâmetro

(E) o valor da estimativa encontrado para o parâmetro

Page 64: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior 13. (ICMS-RJ/2008/FGV) Sejam X e Y duas variáveis aleatórias quaisquer. Então:

A) VAR(X-Y) = VAR(X) - VAR(Y)

B) VAR(X-Y) = VAR(X) + VAR(Y) - COV(X,Y)

C) VAR(X-Y) = VAR(X) + VAR(Y) - 2COV(X,Y)

D) VAR(X-Y) = VAR(X) + VAR(Y) + COV(X,Y)

E) VAR(X-Y) = VAR(X) + VAR(Y) + 2COV(X,Y)

14. (Analista Técnico da SUSEP/2006/ESAF) Sendo X uma v. a. d. -variável aleatória discreta e sendo Y = aX + b, pode concluir-se que var (aX + b) é igual a:

A) = var X.

B) = E(X2) - (EX)2.

C) = E(X - E(X))2.

D) = a2 var X.

E) = a2 var X - b.

15. (AFRF/2005/ESAF) Para uma amostra de dez casais residentes em um mesmo bairro, registram-se os seguintes salários mensais (em salários mínimos):

Identificação do casal 1 2 3 4 5 6 7 8 9 10 Salário do marido (Y) 30 25 18 15 20 20 21 20 25 27 Salário da esposa (X) 20 25 12 10 10 20 18 15 18 13

Sabe-se que:

Assinale a opção cujo valor corresponda à correlação entre os salários dos homens e os salários das mulheres.

A) 0,72

B) 0,75

C) 0,68

D) 0,81

E) 0,78

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 64

Page 65: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior 16. (Analista do BACEN/Área 3/2006/FCC) Sejam X e Y duas variáveis aleatórias e

I. E(X) e E(Y) as expectâncias de X e Y, respectivamente;

II. Var(X) e Var(Y) as variâncias de X e Y, respectivamente;

III. Cov(X,Y) a covariância de X e Y.

Tem-se, em qualquer situação,

A) E(X).E(Y) = E(XY) - Cov(X,Y)

B) Cov(X,Y) = Var(X).Var(Y)

C) E(2X+5) = 4E(X)

D) Se E(XY) = E(X).E(Y), então X e Y são independentes.

E) Var(X+10) = Var(X) + 10

17. (AFRF/2009/ESAF) Na análise de regressão linear simples, as

O enunciado a seguir refere-se às questões de números 18 e 19.

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 65

estimativas da reta de regressão podem ser

obtidas pelo método de Mínimos Quadrados. Nesse caso, os valores dessas estimativas são obtidos através de uma amostra de n pares de valores Xi Y com (i =1, 2, ....,n), obtendo-se:

é a estimativa de Para cada par de valores Xi

Yi com (i =1, 2, ...,n) pode-se estabelecer o desvio ou resíduo - aqui denotado

por ei - entre a reta de regressão Yi e sua estimativa Sabe-se que o

Método de Mínimos Quadrados consiste em adotar como estimativas dos parâmetros ei.

os valores que minimizam a soma dos quadrados dos desvios

Desse modo, o Método de Mínimos Quadrados consiste em minimizar a expressão dada por:

Page 66: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

A função densidade de probabilidade conjunta de duas variáveis aleatórias discretas é dada pela tabela a seguir:

Y 1 3 9

2 1/8 1/24 1/12 X 4 1/4 1/4 0

6 1/8 1/24 1/12

18. A covariância entre X e Y é

A) 1

B) 3

C) 4

D) 12

E) 0

19. Assinale a alternativa correta.

A) X e Y não são independentes.

B) X e Y são independentes.

C) X e Y são correlacionadas.

D) X e Y têm distribuição conjuntamente normal.

E) X e Y têm distribuições marginais normais.

O enunciado a seguir refere-se às questões de números 20 e 21.

Considere as variáveis aleatórias independentes Xl,X2,...,Xn. Suponha que

essas n variáveis possuam a mesma distribuição de probabilidades com média

20. Podemos afirmar que o valor esperado de

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 66

Page 67: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

Utilizando a equação da reta obtida pelo método dos mínimos quadrados, tem-se que, caso haja um gasto anual com propaganda de 80 mil reais, a previsão do lucro bruto anual, em mil reais, será de

A) 84

B) 102,5

C) 121

D) 128,4

E) 158

23. (INÉDITA) Considere os dados da questão 22. O coeficiente de correlação é de

A) 0

B) 2,5

C) 1,25

D) 0,88

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 67

21. Podemos afirmar que a variância de

22. (Analista do BACEN/Área 3/2006/FCC) Uma empresa, com a finalidade de determinar a relação entre os gastos anuais com propaganda (X), em R$ 1 000,00, e o lucro bruto anual (Y), em R$1.000,00, optou por utilizar o modelo linear simples é o valor do lucro bruto

auferido no ano i, Xi é o valor gasto com propaganda no ano

aleatório com as respectivas hipóteses consideradas para a regressão linear simples são parâmetros desconhecidos).

Considerou, para o estudo, as seguintes informações referentes às observações nos últimos 10 anos da empresa:

Page 68: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior E) 0,63

24. (ICMS-RJ/2008/FGV) Sejam X, Y e Z três variáveis com correlações de Pearson expressas pela matriz abaixo:

X Y Z X 1,000 Y 0,800 1,000 Z 0,000 -0,500 1,000

Pode-se, então, afirmar que:

A) X e Z são independentes.

B) a correlação parcial entre X e Y, após a correção para Z, é negativa.

C) o coeficiente de determinação da regressão de Y em X é maior do que 60%.

D) a correlação entre V = a + b.X e W = c + d.Z, com a ^ 0, c ^ 0, b>0 e d<0 é negativa.

E) a covariância entre X e Y é igual a 0,64.

25. (ICMS-RJ/2009/FGV) Utilizando uma análise de regressão linear simples, um pesquisador obteve um ajuste Y = aX + bi e um coeficiente de determinação R2 . Um segundo pesquisador analisou os mesmos dados, mas antes aplicou a cada observação de Y a transformação Y' = 10Y + 100, obtendo um outro ajuste Y' = a2x + b2, com um coeficiente de determinação R2 . Considere as afirmativas abaixo, relativas à comparação entre os valores obtidos nas duas análises:

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 68

Assinale:

A) se somente a afirmativa I for verdadeira.

B) se somente as afirmativas I e II forem verdadeiras.

C) se somente as afirmativas I e III forem verdadeiras.

D) se somente as afirmativas II e II forem verdadeiras.

E) se todas as afirmativas forem verdadeiras.

26. Seja a função densidade de probabilidade

para os demais valores de x. Suponha que X1 e X2 sejam variáveis aleatórias independentes, cada uma delas com a função densidade de probabilidade f(x).

Page 69: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior Então podemos afirmar que a função densidade de probabilidade conjunta f(x1,x2) é

Obtenha a reta de regressão linear de Y em X.

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 69

27. (Fiscal de Rendas do Município do RJ/2010/ESAF) A partir de uma amostra aleatória simples formada por 22 observações das variáveis X e Y calculou-se

28. (Fiscal de Rendas do Município do RJ/2010/ESAF) Com os dados da questão anterior, calcule o valor mais próximo do coeficiente de determinação R2 da regressão linear de X em Y.

A) 0,65

B) 0,81

C) 0,85

D) 0,91

E) 0,88

Page 70: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

29. (ICMS-RJ/2011/FGV) A tabela abaixo mostra os valores de duas variáveis, X e Y.

X Y 4 4,5 4 5 3 5 2 5,5

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 70

Sabe-se que

O valor de b na regressão simples Y = a + bX é

A) 11/5

B) -3/8

C) -4/11

D) -4/17

E) -11/65

30. (ICMS-RJ/2011/FGV) Para duas variáveis populacionais, X e Y, o desvio-padrão de X é 40, o desvio-padrão de Y é 20 e a covariância entre Y e X é -100. Assim, o coeficiente de correlação entre X e Y é

A) -0,5.

B) 2

C) -0,25

D) -0,125

E) 0,125

31. (Economista-CODEBA/2010/FGV) Sejam X, X2, X3,..., XN variáveis

aleatórias para uma amostra de tamanho N.

Defina a Média amostral

avalie as afirmativas abaixo:

Page 71: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior

III. O valor esperado de

Assinale

A) se apenas as afirmativas I e II estiverem corretas.

B) se apenas as afirmativas I e III estiverem corretas.

C) se apenas as afirmativas II e III estiverem corretas.

D) se todas as afirmativas estiverem corretas.

E) se nenhuma das afirmativas estiver correta.

Exercícios de Revisão

(AFTM-SP/2007/FCC/Adaptada) Instruções: para responder à próxima questão, utilize, dentre as informações abaixo, as que julgar adequadas. Se Z tem distribuição normal padrão, então:

P(0< Z < 1) = 0,341, P(0< Z < 1,6) = 0,445, P(0< Z < 2) = 0,477

32. Os depósitos efetuados no Banco B, num determinado mês, têm distribuição normal com média R$ 9.000,00 e desvio padrão R$ 1.500,00. Um depósito é selecionado ao acaso dentre todos os referentes ao mês em questão. A probabilidade de que o depósito exceda R$ 6.000,00 é de

A) 97,7%

B) 94,5%

C) 68,2%

D) 47,7%

E) 34,1%

33. (AFTE-RS/2009/Fundatec) Seja X uma variável aleatória contínua, com

34. (AFTE-RS/2009/Fundatec) Seja Z uma variável aleatória contínua

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 71

I. O valor esperado da média amostral é

II. A variância da média amostral é

A) 0,5

B) 0

C) 2/3

D) 1

E) 1/3

função densidade de probabilidade dada por O valor da média de X é

Page 72: Raciocínio Lógico - Aula 09

Curso Online - Raciocínio Lógico-Quantitativo para Traumatizados em Exercícios, incluindo Matemática, Matemática Financeira e Estatística

Profs. Alexandre Lima e Moraes Junior normalmente distribuída com média zero e desvio padrão um. Seja P(Z < - 1 ) = 0,1587 e P(Z > 2) = 0,0228 . Seja X uma variável aleatória contínua

normalmente distribuída com média 200 e desvio padrão 20, então P(180<X<240), é:

A) 0,9772

B) 0,8413

C) 0,3413

D) 0,8185

E) 0,4772

Profs. Alexandre Lima e Moraes Junior www.pontodosconcursos.com.br 72