Estatística Erros e var. aleatórias Erros e variáveis aleatórias 1 -tipos dos erros, exactidão...
Transcript of Estatística Erros e var. aleatórias Erros e variáveis aleatórias 1 -tipos dos erros, exactidão...
EstatísticaErros e var. aleatórias
Erros e variáveis aleatórias
1
-tipos dos erros, exactidão e precisão
-variáveis aleatórias e seus tipos
-função de distribuição cumulativa
-função de distribuição de probabilidade, e função densidade de probabilidade
-distribuições conjuntas de duas variáveis aleatórias
-valor de esperança matemática e suas propriedades
-variância e suas propriedades, covariância
-desigualdades de Markov e Chebyshev
Pontos mais importantes:
EstatísticaErros e var. aleatórias
Revisão sugerida:
- Integração de funções simples (linear, exponencial)
- Integração de funções simples com duas variáveis
- Definição de funções matemáticos
- Definição de valor médio de uma função contínua
2
EstatísticaErros e var. aleatórias
Em qualquer área de estudos de que resultem valores numéricos, é essencial uma estimativa dos erros associados à medição, sem isso temos pouca informação.
3
-a concentração de ácido láctico em duas mostras de iogurte produzido pela lactobacilos “A” e “B” são 100mg/l e 107 mg/l respectivamente. Se o erro de determinação for 1 mg/l as amostras são diferentes? E se o erro de determinação for 10 mg/l?
- Em quatro réplicas da mesma titulação resultam consumos de 24.69, 24.73, 24.77 e 25.39 ml. Podemos desprezar o último valor?
EstatísticaErros e var. aleatórias
4
Tipos dos erros:
-erro grosso: um erro muito sério, a experiência tem que ser repetida
-erro aleatório: resultados individuais andam à volta do valor verdadeiro sem uma sequência previsível. A grandeza deste tipo do erro determina a precisão da experiência. É impossível eliminar, mas pode ser facilmente quantificado.
-erro sistemático: desvio de medição do valor verdadeiro no mesmo sentido. O termo correspondente a este erro chama-se exactidão. Geralmente é difícil identificar.
erro aleatório
erro sistemáticoincerteza
EstatísticaErros e var. aleatórias
5
Exemplo: 4 alunos (A-D) titularam exactamente 10ml de 0.1M NaOH com exactamente 0.1 HCl. A experiência foi repetida 5 vezes.
10.00 10.309.70
Resultado correcto
A
B
C
D
ml
Preciso, não exacto
Não preciso, exacto
Não preciso, não exacto
Preciso, exacto
EstatísticaErros e var. aleatórias
6
Objectivos da análise estatística:
-cuidadoso planeamento das experiências
-análise dos resultados e quantificação dos erros
EstatísticaErros e var. aleatórias
7
Variáveis aleatórias (v.a.):
o resultado (quantidade) de uma experiência (estatística) não se conhece antecipadamente, pois pode ter vários valores, mas se conhece as probabilidades de ocorrência, chama-se a isto uma variável aleatória.
Seja X o total do lançamento de dois dados honestos:P { X = 2} = P{( 1, 1)} = 1/ 36P { X = 3} = P{( 1, 2),( 2, 1)} = 2/ 36P { X = 4} = P{( 1, 3),( 2, 2),( 3, 1)} = 3/ 36P { X = 5} = P{( 1, 4),( 2, 3),( 3, 2),( 4, 1)} = 4/ 36P { X = 6} = P{( 1, 5),( 2, 4),( 3, 3),( 4, 2),( 5, 1)} = 5/ 36P { X = 7} = P{( 1, 6),( 2, 5),( 3, 4),( 4, 3),( 5, 2),( 6, 1)} = 6/ 36P { X = 8} = P{( 2, 6),( 3, 5),( 4, 4),( 5, 3),( 6, 2)} = 5/ 36P { X = 9} = P{( 3, 6),( 4, 5),( 5, 4),( 6, 3)} = 4/ 36P { X = 10} = P{( 4, 6),( 5, 5),( 6, 4)} = 3/ 36P { X = 11} = P{( 5, 6),( 6, 5)} = 2/ 36P { X = 12} = P{( 6, 6)} = 1/ 36
EstatísticaErros e var. aleatórias
8
Tipos de variáveis aleatórias:
-discreta: variável aleatória que só pode ter um número de valores numeráveis
e.g. seja Y o número de vezes que se lança uma moedahonesta até sair coroa.P{ Y = 1} = 1/ 2P{ Y = 2} = 1/ 4...P{ Y = n } = ½ (½) n -1
Y só pode assumir valores inteiros positivos; Os p Y n formam uma sequência infinita numerável. X e Y são variáveis aleatórias discretas.
-contínua: pode assumir qualquer valor real positivo, o seu domínio tem a potência do contínuo
e.g. duração da vida de uma automóvel
EstatísticaErros e var. aleatórias
9
Função de distribuição cumulativa:
Para descrever variáveis aleatórias e as suas probabilidades é muito útil definir a função F de uma variável aleatória X,
F=P(Xx) x
F é a probabilidade de X ter um valor menor ou igual a x.
Usando a Função de distribuição cumulativa podemos determinar todas
as probabilidades. Suponha que queremos calcular a probabilidade de
P(a<X b). Aplicando Axioma III temos,
P (Xb)= P (X a)+P(a<X b) P(a<X b)= F(b)-F(a)
F(b) F(a)
EstatísticaErros e var. aleatórias
10
Exemplo: qual é a probabilidade de X>1 se,
0x
0x
)xexp(1
0)x(F 2
Características: -crescente monótona -F(-)=0- F()=1-todas as funções reais com estas características definem funções de distribuição
P(X>1)= 1-P(X1)= 1-F(1)= exp(-1)=0.386
EstatísticaErros e var. aleatórias
11
Função de distribuição de probabilidade: Seja X uma variável aleatória discreta. A função de distribuição de
probabilidades p(a) de X é definida pela,
p(a)=P(X=a)
Características: -X só pode ter valores x1,x2,...,xn, onde n é finito,p(xi)>0, i=1,2,...,np(x)=0, todos outros
-
-a relação entre F(x) e p(x):
-F(x) é uma função de degrau
1i
i 1)x(p
ax
)x(p)a(F
EstatísticaErros e var. aleatórias
12
Exemplo: Seja X uma variável aleatória que pode assumir valores de 1,2,3 com as respectivas probabilidades, 1/2, 1/3, 1/6
x
p(x)
1
1/6
1/3
1/2
32
x
F(x)
1
1/2
5/61
32
p(1)=1/2p(2)=1/3p(3)=1/6
a3
3a2
2a1
1a
1
6/5
2/1
0
)a(F
EstatísticaErros e var. aleatórias
13
Função densidade de probabilidade: No caso de uma variável contínua a probabilidade P(X=a)=0. Seja X
uma v.a. contínua, existe uma função não negativa f(x) definida
para xR, que tem a propriedade,
b
a
dx)x(f)bXa(P
onde f(x) chama-se Função densidade de probabilidade de X. A
probabilidade de X estar em (b-a) é igual o integral de f(x) sob b-a.
Também pode se dizer que a probabilidade de X estar na vizinhança
de “a” no intervalo é igual a f(a),
)a(fdx)x(f)2
aX2
a(P2
a
2a
EstatísticaErros e var. aleatórias
14
Características:
a
dx)x(f)aX(P)a(F
dx)x(f)X(P1
- 0dx)x(f)aX(Pa
a
-
-
Exemplo: Seja X uma v.a. tal que:
outros para
2x0
0
)x2x4(8
3)x(f
2
Calcule a probabilidade x>1!
2
1
2
1
2
1
5.0dx)x2x4(8
3dx)x(fdx)x(f)1x(p
da
)a(dF)a(f
EstatísticaErros e var. aleatórias
15
Distribuições conjuntas de duas v.a.:
Muitas vezes o que tem interesse é saber as probabilidades de duas variáveis aleatórias. A definição de função de distribuição conjunta de X e Y,
F(x,y)=P(Xx, Y y)x,y
Teoricamente, qualquer questão de probabilidade sobre X e Y pode ser calculada sabendo F(X,Y).A função de distribuição de individuais,
F(x)= P(Xx)= P(Xx, Y )=F(x, );
F(y)= P(Yy)= P(X, Y y)=F(,y);
As características das funções de distribuição são também verdadeiras para v.a. conjuntas
EstatísticaErros e var. aleatórias
16
No caso de variáveis discretas, a função de distribuição de probabilidade de X (x1,x2,...) e Y (y1,y2,...) é definida pela:
p(xi,yj)=P(X=xi,Y=yj)
)y,x(p)xX(P)x(p jj
iiiX ),()()( ji
ijjY yxpyYPyp
A função de distribuição de probabilidade individual (marginal) pode obter-se:
i \ j 0 1 2 3 p (X i)0 0. 15 0. 1000 0. 0875 0. 0375 0. 37501 0. 1000 0. 1750 0. 1125 0 0. 38752 0. 0875 0. 1125 0 0 0. 20003 0. 0375 0 0 0 0. 0375p (Y j) 0. 3750 0. 3875 0. 2000 0. 0375 1
Exemplo: Sequência das probabilidades de ter X filhos e Y filhas numa família portuguesa se: 15% tem 0, 20% tem 1, 35% tem 2 e 30% tem 3 crianças.
EstatísticaErros e var. aleatórias
17
Se X e Y foram duas v.a.-s contínuas, existe uma função f(x,y) para a qual se verifica:
d
c
b
a
dxdy)y,x(f)dYc,bXa(P X,YR
Onde f(x,y) se chama função densidade de probabilidade conjunta de X e Y. As funções densidade de probabilidade marginais são dadas por:
b
a
X
b
a
dx)x(fdydx)y,x(f)bXa(P
d
c
Y
d
c
dy)y(fdxdy)y,x(f)dYc(P
A relação entre F(x,y) e f(x,y):
db
)d,b(F)d,b(fdxdy)y,x(f)dY,bX(Pd)F(b,
2d b
EstatísticaErros e var. aleatórias
18
Exemplo: Seja f(x,y) a função densidade de probabilidade conjunta das variáveis aleatórias continuas X e Y:
outros para
yx,0
0
ee2)y,x(f
y2x
Calcule a) P(X>1,Y<1) e b) P(X<a).
%8.31)e1(e1eee2
1e2
dye2edy)e(e2dydxee2)1Y,1X(P
21211
0y21
1
0
1
0
y21
1
xy21
0 1
y2x
aaa
0
x
a
0
xa
0 0y2xa
0 0
y2x
e11edxe
dx10edxe2
1e2dxdyee2)aX(P
Nota: Os conceitos de distribuição conjuntas podem ser facilmente generalizados para “n” v.a.-s.
a)
b)
EstatísticaErros e var. aleatórias
19
Distribuições condicionais de duas v.a.:
-Discretas:
)F(P
)EF(P)F|E(P
)y(p
)y,x(p
)yY(P
)yY,xX(P)y|x(p
Y
Assim, é relativamente fácil definir a função de distr. de prob. condicional:
-Contínuas:
dxyxfyYbxaPyf
yxfyxf
b
aY )|()|(
)(
),()|(
-Independência:
f(x,y)=fX(x)fY(y)p(x,y)=pX(x)pY(y)
EstatísticaErros e var. aleatórias
20
Valor de esperança matemática:
O valor esperança de uma variável aleatória discreta X é a média pesada dos valores possíveis:
i
iii
ii )x(px)xX(PxXE
O factor de peso é a probabilidade do correspondente valor da v.a. Por outras palavras, o valor de esperança é o valor médio que se obtém após um grande número de repetições.
Exemplo: Seja X uma v.a. que representa o dinheiro que uma pessoa ganha num jogo de azar (x1, x2, ... xn) com as probabilidades respectivas (p(x1), p(x2), ... P(xn)). Calcule quanto é que pode esperar ganhar por jogo numa noite. Aproximadamente toda noite Np(xi) vezes vamos ganhar xi (nota que ni= Np(xi)), por isso o dinheiro total que vamos ganhar:
XE)x(pxN
)x(Npx)x(Npx
n
1iii
n
1iii
jogo porn
1iii
EstatísticaErros e var. aleatórias
21
Um caso especial é quando todos os valores de v.a. tem a mesma probabilidade:
N
x
N
1x)xX(PxXE i
i
ii
iii
Exemplo: Calcule o valor de esperança dos lançamentos do um dado
5.36
654321)i(ip)x(pxXE
6
1i
6
1iii
EstatísticaErros e var. aleatórias
22
Exemplo: Suponha que uma aula teórica deve acabar alguns minutos depois hh:50 min. As que horas vai acabar a aula em média se a função densidade de probabilidade do atraso é dada pela:
outros para
15x0
015
1)x(f
5.730
15dx
15
xdx)x(xfXE
215
0
15
0
Em média a aula acaba hh:58 min.
Agora, suponha que X é uma v.a. continua. A probabilidade de X estar na vizinhança (para dx pequeno) de x é:
P(x<X<x+dx)f(x)dx
Com analogia ao caso de v.a. discreta o valor de esperança pode ser facilmente obtida:
dx)x(xfXE
EstatísticaErros e var. aleatórias
23
Propriedades de valor de esperança matemática:
Dada uma v.a. X e a correspondente distribuição de probabilidade. Suponha que estamos interessados no valor de esperança de uma função de g(X) (E[g(X)]). Como se calcule?
Discreta: i
iii
ii )x(p)x(g)xX(P)x(g)X(gE
Exemplo: Seja X uma v.a. com a função de distr. de probabilidade:p(0)=0.2p(1)=0.5p(2)=0.3
Calcule E[X2]
7.13.45.012.00)x(p)x(gX)X(gE3
1iii
2
EstatísticaErros e var. aleatórias
24
Exemplo: O tempo que demora a localizar um problema no processamento de leite (X) tem uma função densidade de probabilidade:
Contínua:
dx)x(f)x(g)X(gE
outros para
1x0
0
1)x(f
O custo relacionado a reparação é X3 mil contos. Qual é o custo esperado de resolução dos problemas?
25.0dxxdx)x(f)x(g)X(gE1
0
31
0
EstatísticaErros e var. aleatórias
25
Caso especial: transformação linear de v.a., g(X)=aX+b, onde a e b são constantes
Discreta:
bXaE)x(pb)x(pxa)x(p)bax(baXEi
ii
iii
ii
Contínua:
bXaEdx)x(fbdx)x(xfadx)x(f)bax(baXE
EstatísticaErros e var. aleatórias
26
As propriedades de valores de esperança pode ser aplicadas para mais que uma v.a.
Discreta:
Contínua:
y x
)y,x(p)y,x(g)Y,X(gE
dydx)y,x(f)y,x(g)Y,X(gE
E.g.
YEXEdy)y(yfdx)x(xfdydx)y,x(fydxdy)y,x(fx
dydx)y,x(yfdydx)y,x(xfdydx)y,x(f)yx(YXE
YX
E[X1+ X2+...+ Xn]= E[X1]+E[ X2]+...+E[ Xn]
EstatísticaErros e var. aleatórias
27
Variância:
As funções de distribuição de probabilidade podem-lhes tornar complicadas, por isso seria muito útil somar as características mais essenciais em umas medidas. O valor de esperança E[X] é um bom candidato, mas insuficiente, porque não fornece informação sobre a dispersão da v.a. em volta da média pesada.
E.g.: A altura dos adultos de Portugal em média é 1.70 m. Um extraterrestre de Marte podia pensar que ninguém é mais alto que 1.71m, um outro de Vénus podia pensar que há pessoas mais baixas que 0.1m.
O que longe os valores de X podem ser esperados da média )-E[X-]=0 ----> não funciona
-E[|X-|] ----> não é conveniente calcular o modulo
-E[(X-)2]
EstatísticaErros e var. aleatórias
28
Variância: Var(X)=E[(X-)2]=2
Cálculo alternativo:
22
2222
2222
-]E[X
E[X]2-]E[X][EX]E[2-]E[X
)]X2-E[(X ])-E[(XVar(X)
Exemplo: Calcule a variância dos lançamentos do um dado
2
7
6
654321)i(ip
6
1i
6
91
6
654321)i(piXE
2222226
1i
22
2=91/6-(7/2)2=35/12
EstatísticaErros e var. aleatórias
29
Propriedades da variância:
)X(Vara])-E[(Xa])-(XE[a
])a-E[(aX]b)a-bE[(aX
]b])E[aX-bE[(aXb)Var(aX
22222
22
2
)X(Varb)Var(X
0Var(b)
)X(VaraVar(aX) 2
)X(Var2)X2(VarX)Var(X 2
EstatísticaErros e var. aleatórias
30
Suponha que num supermercado o peso de embalagem de pimento assado tem =0.5 kg com Var=0.05kg2. A dispersão é grande ou não? É difícil avaliar, porque e Var(X) não têm a mesma dimensão.
Desvio padrão ():)X(Var
No exemplo anterior, =0.5 kg e =0.22kg, a dispersão dos peso das embalagens é bastante grande.
EstatísticaErros e var. aleatórias
31
Covariância:
A covariância é medida de dependência linear entre variáveis aleatórias. Definição de covariância de duas v.a.:
E[X]E[Y]-E[XY]-E[XY]
]X[E]YE[-E[XY]
]X-Y-E[XY )]-)(Y-E[(XY)Cov(X,
yxxyyx
yxyx
yxyxyxyx
Propriedades: a) Cov(X,Y)=Cov(Y,X)
b) Cov(X,X)=Var(X)
c) Cov(aX,Y)=aCov(X,Y)
d) Cov(X+Z,Y)=Cov(X,Y)+Cov(Z,Y)
e) v.a. independentes Cov(X,Y)=0
EstatísticaErros e var. aleatórias
32
Propriedade d) pode ser generalizada para a covariância de X e Y:
n
1i
m
1jji
m
1jj
n
1ii )YX(CovY,XCov
Assim, a variância de soma de n v.a.-s pode ser determinada usando a propriedade b:
n
1i
m
ij1j
ji
n
1ii
n
1ii
n
1jj
n
1ii )YX(Cov)X(VarXVarX,XCov
Independência(!):
n
1ii
n
1ii )X(VarXVar
EstatísticaErros e var. aleatórias
33
Exemplos para Cov(X,Y)0:
-altura e peso das pessoas: Pessoas mais altas tendem ser mais pesadas-----> cov>0
-velocidade de reacção dos condutores e a quantidade de álcool consumido: com aumento de álcool bebido, a velocidade de reacção diminuí-----> cov<0
O valor de covariância depende das unidades usadas no cálculo (kg/g; min/s; l/ml, etc.). A “covariância normalizada” chama-se coeficiente de correlação:
1)Y(Var)X(Var
)Y,X(Cov)Y,X(Corr1 y,x
Independência: x,y=0
EstatísticaErros e var. aleatórias
34
Por vezes dado um número de v.a. (e.g. parâmetros de um modelo matemático) e queremos saber a dependência linear entre eles. O resultado é a matriz de covariância (simétrica):
n1n
212
n1211
ji
x2
xx
x2
xx
xxxxx2
xx
Ou em termos de coeficiente de correlação:
1
1
1
1n
12
n121
ji
xx
xx
xxxx
xx
EstatísticaErros e var. aleatórias
35
Desigualdades de Markov e Chebyshev:
-Desigualdade de Markov: se a v.a. X for não-negativa, então:
0a
a
XE)aX(P
v.a. contínua:
)()()(
)()()()(00
aXaPdxxfadxxaf
dxxxfdxxxfdxxxfdxxxfXE
aa
aa
a
-Desigualdade de Chebyshev: seja a=k2 e a v.a. não-negativa igual a (X-)2:
2
2
2
222
k
k
)X(E)k)X((P)kX(P
EstatísticaErros e var. aleatórias
36
A importância destas desigualdades é que permitem estabelecer limites de probabilidades quando só a média e/ou a variância estão conhecidas (sem saber a função de distribuição de probabilidade)
Exemplo: O número de testes feitos num laboratório de controlo de qualidade em média 50/dia.
-Calcule o limite da probabilidade do número de testes exceder 75 num dia!
P(X>75)E[X]/75=50/75=2/3
-se a variância for 25, qual é o limite de prob. de o número de testes serem cera de 40-60/dia?
P(|X-50|10) 2/102=1/4 ------> P(|X-50|<10) >1-1/4=3/4