EE-240/2009
Estimação Não-Paramétrica EE-240/2009Estimação Não-Paramétrica
EE-240/2009
Estimação Não-Paramétrica
• Assumir uma certa distribuição (normal, exponencial, Weibull, etc.)
• Estimar os parâmetros da distribuição a partir das observações
• Utilizar a distribuição com os parâmetros estimados.
Estimação Paramétrica
EE-240/2009
Estimação Não-Paramétrica
Densidade Normal
EE-240/2009
Estimação Não-Paramétrica
30 observações
EE-240/2009
Estimação Não-Paramétrica
Função densidade de probabilidade estimada(assumindo distribuição normal)
OK
EE-240/2009
Estimação Não-Paramétrica
Uma Densidade Bimodal
EE-240/2009
Estimação Não-Paramétrica
30 observações
EE-240/2009
Estimação Não-Paramétrica
Função densidade de probabilidade estimada(assumindo distribuição normal)
No Good!
EE-240/2009
Estimação Não-Paramétrica
• Nãoassumir um tipo específico de distribuição a priori
• Estimar a densidade de probabilidade a partir das observações
• Utilizar a densidade de probabilidade estimada.
Métodos não-paramétricos
EE-240/2009
Estimação Não-Paramétrica
Exemplo: Histograma (1)
EE-240/2009
Estimação Não-Paramétrica
30 observações
EE-240/2009
Estimação Não-Paramétrica
Divisão do intervalo em 10 trechos
EE-240/2009
Estimação Não-Paramétrica
Normalizar
EE-240/2009
Estimação Não-Paramétrica
Ajustar
EE-240/2009
Estimação Não-Paramétrica
Divisão do intervalo em 5 trechos
EE-240/2009
Estimação Não-Paramétrica
Divisão do intervalo em 20 trechos
EE-240/2009
Estimação Não-Paramétrica
60 observações
EE-240/2009
Estimação Não-Paramétrica
120 observações
EE-240/2009
Estimação Não-Paramétrica
240 observações
EE-240/2009
Estimação Não-Paramétrica
480 observações
EE-240/2009
Estimação Não-Paramétrica
960 observações
EE-240/2009
Estimação Não-Paramétrica
1920 observações
EE-240/2009
Estimação Não-Paramétrica
Divisão do intervalo em 10 trechos
30 observações
EE-240/2009
Estimação Não-Paramétrica
Divisão do intervalo em 20 trechos
EE-240/2009
Estimação Não-Paramétrica
3840 observações
EE-240/2009
Estimação Não-Paramétrica
• “Kernel density estimation”:
K(x) = Função kernel de “área unitária”
h = Parâmetro de alargamento (suavização)
EE-240/2009
Estimação Não-Paramétrica
h=1h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=1
Kernel Retangular, h=1
EE-240/2009
Estimação Não-Paramétrica
h=2
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Retangular, h=2
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Triangular, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
Kernel Gaussiano, h=1
EE-240/2009
Estimação Não-Paramétrica
[F,XI]=KSDENSITY(X) computes a probability density estimate of the sample in the vector X. KSDENSITY evaluates the density estimate at 100 points covering the range of the data. F is the vector of density values and XI is the set of 100 points. The estimate is based on a normal kernel function, using a window parameter (bandwidth) that is a function of thenumber of points in X.
F=KSDENSITY(X,XI) specifies the vector XI of values where the density estimate is to be evaluated.
(Matlab Statistics Toolbox)
EE-240/2009
Estimação Não-Paramétrica
Vantagens
Métodos paramétricos:
• Propriedades teóricas bem-estabelecidas.
Métodos não-paramétricos:
• Dispensam a escolha a priori
de um tipo de distribuição.
• Aplicabilidade mais ampla.
• Simplicidade de uso.
EE-240/2009
Estimação Não-Paramétrica
Métodos paramétricos:
• Podem levar a resultados inadequados se a população não seguir a distribuição assumida na análise.
Métodos não-paramétricos:
• Requerem um número maior de amostras para atingir a mesma “qualidade” de ajuste.
• Maior dificuldade para o estabelecimento de propriedades teóricas.
Desvantagens
EE-240/2009
Estimação Não-Paramétrica
Bootstrap
EE-240/2009
Estimação Não-Paramétrica
• Motivação: Em muitos casos, pode não ser trivial obter o intervalo de confiança para uma dada estimativa.
• Exemplo (prognóstico baseado em análise de tendência): Previsão da Remaining Useful Life com base na série histórica de um índice de degradação.
EE-240/2009
Estimação Não-Paramétrica
EE-240/2009
Estimação Não-Paramétrica
• Pode não ser possível obter o intervalo de confiança de forma analítica se os dados não se conformarem às hipóteses usuais (ruído gaussiano, homoscedástico, etc.)
EE-240/2009
Estimação Não-Paramétrica
• Bootstrap: Técnica de reamostragem (com reposição) que pode ser empregada para obter informações sobre a incerteza associada a uma estimativa.
EE-240/2009
Estimação Não-Paramétrica
Amostragem com reposição
Conjuntooriginal
Bootstrap
Reamostragem
EE-240/2009
Estimação Não-Paramétrica
Conjuntooriginal
Bootstrap
Reamostragem
EE-240/2009
Estimação Não-Paramétrica
Conjuntooriginal
Bootstrap
Reamostragem
EE-240/2009
Estimação Não-Paramétrica
Conjuntooriginal
Bootstrap
Reamostragem
EE-240/2009
Estimação Não-Paramétrica
Conjuntooriginal
Bootstrap
Reamostragem
EE-240/2009
Estimação Não-Paramétrica
Conjuntooriginal
Bootstrap
Reamostragem
EE-240/2009
Estimação Não-Paramétrica
Conjuntooriginal
Bootstrap
Reamostragem
EE-240/2009
Estimação Não-Paramétrica
Conjuntooriginal
Reamostragens
Bootstrap 1
Bootstrap 2
Bootstrap 3
EE-240/2009
Estimação Não-Paramétrica
Uso de Bootstrap em estimação
• Considere que uma variável y tenha sido estimada a partir de n observações de uma variável x:
• Sejam X1, X2, ..., XN bootstraps gerados a partir de X. Seja ainda:
• Pode-se então levantar estatísticas com base nas N estimativas resultantes.
EE-240/2009
Estimação Não-Paramétrica
• Exemplo 1: Estimativa da Mediana
Amostra de 10 observações gerada a partir de uma distribuição
uniforme no intervalo [0, 10] (números inteiros):
X = { 10, 2, 6, 5, 9, 8, 5, 0, 8 }.
Cálculo da mediana:
Xordenado = { 0, 2, 5, 5, 6, 8, 8, 9, 10 }
EE-240/2009
Estimação Não-Paramétrica
• Estimativas obtidas (em ordem crescente):
• Intervalo de confiança para a estimativa (70% de confiança 5-6):
EE-240/2009
Estimação Não-Paramétrica
• Exemplo 2 Estimativa de Mediana
Amostra de 30 observações gerada a partir de uma distribuição uniforme no intervalo [0, 10]:
EE-240/2009
Estimação Não-Paramétrica
• Exemplo 2 Estimativa de Mediana
Amostra de 30 observações gerada a partir de uma distribuição uniforme no intervalo [0, 10]:
•Em 69 dos 100 bootstraps, a mediana obtida estava no intervalo [4, 6].
•Intervalo [4, 6] 69% de confiança.
EE-240/2009
Estimação Não-Paramétrica
Densidade de probabilidadepara o resultado obtido por Bootstrap
• Pode-se aplicar o método das janelas de Parzen aos resultados obtidos a partir dos bootstraps.
• Neste caso, o resultado de cada bootstrap é considerado uma “observação” da grandeza a ser estimada.
EE-240/2009
Estimação Não-Paramétrica
Exemplo anterior com kernel gaussiano
EE-240/2009
Estimação Não-Paramétrica
Bootstrap e análise de tendência
EE-240/2009
Estimação Não-Paramétrica
d
t
d
t
d
t
d
t
EE-240/2009
Estimação Não-Paramétrica
BOOTSTRP Bootstrap statistics.
BOOTSTRP(NBOOT,BOOTFUN,...) draws NBOOT bootstrap data samples and analyzes them using the function, BOOTFUN. NBOOT must be a positive integer. The third and later arguments are the data; BOOTSTRP passes bootstrap samples of the data to BOOTFUN.
(Matlab Statistics Toolbox)
EE-240/2009
Estimação Não-Paramétrica
Muito Obrigado!
Top Related