EE-240/2009 Estimação Não-Paramétrica EE-240/2009 Estimação Não-Paramétrica.
Estimação de parâmetros Aula 05 Prof. Christopher Freire Souza Centro de Tecnologia Universidade...
Transcript of Estimação de parâmetros Aula 05 Prof. Christopher Freire Souza Centro de Tecnologia Universidade...
Estimação de parâmetrosAula 05
Prof. Christopher Freire SouzaCentro de TecnologiaUniversidade Federal de Alagoaswww.ctec.ufal.br/professor/cfs
Objetivos
•Desenvolver habilidades para estimar valores de parâmetros
•Promover o entendimento do que são intervalos de confiança
•Desenvolver habilidades para estimar tamanhos amostrais
2
Christopher Souza: Estimação de
parâmetros
Relevância do conteúdo• Estimação de
parâmetros serve a dois propósitos:▫ Comparar populações▫ Ajustar modelos de
distribuição de probabilidades a dados amostrais no intuito de permitir interpolações e extrapolações sobre freqüências de ocorrência de valores.
Christopher Souza: Estimação de
parâmetros
3
Conteúdo
•Características dos estimadores•Estimação Pontual•Intervalos de confiança•Margem de Erro•Tamanhos amostrais
4
Christopher Souza: Estimação de
parâmetros
Características dos estimadores• Consistência –
• Ausência de viés –
• Eficiência –
Christopher Souza: Estimação de
parâmetros
5
Estimadores pontuais
•Método gráfico•Método dos momentos•Método dos mínimos quadrados•Método da máxima verossimilhança
Christopher Souza: Estimação de
parâmetros
6
Método gráfico• Papéis de probabilidade e posição de plotagem definida via
estimativa empírica de probabilidade
Christopher Souza: Estimação de
parâmetros
7
0,50
Método gráfico• Ajuste de reta aos dados
dispostos segundo fórmula de posição de plotagem (qi é a probabilidade empírica)
Christopher Souza: Estimação de
parâmetros
8
0,50
Método gráfico• Estimativa de parâmetros
a partir da relação entre equação da reta e variáveis dispostas nos eixos▫ Grigorten:
qi=(i-0,44)/(n+0,12)
▫ Gumbel:▫ Inversa:
Christopher Souza: Estimação de
parâmetros
9
Método gráfico• Grau de linearidade dos
dados dispostos no gráfico serve à avaliação do ajuste ao modelo de distribuição para o qual foi elaborado o papel de probabilidade
• Quantidade de dados pode levar as posições de plotagem de probabilidades a valores que mais aproximem dados à reta▫ Grigorten:
qi=(i-0,44)/(n+0,12)
Christopher Souza: Estimação de
parâmetros
10
Método dos Momentos• Aproxima-se a estimativa de parâmetros
populacionais por meio de estimativas de momentos amostrais.
• Os “m” coeficientes de um modelo de distribuição de probabilidades podem ser aproximados pelas equações dos “m” primeiros momentos amostrais.
Christopher Souza: Estimação de
parâmetros
11
Método dos MomentosAmostra Médi
aMediana
Amp. Var. std Prop. Ímpar
Prob.
1,1 1,0 1,0 0 0,0 0,0 1 1/9
1,2 1,5 1,5 1 0,5 0,707
0,5 1/9
1,5 3,0 3,0 4 8,0 2,828
1 1/9
2,1 1,5 1,5 1 0,5 0,707
0,5 1/9
2,2 2,0 2,0 0 0,0 0,0 0 1/9
2,5 3,5 3,5 3 4,5 2,121
0,5 1/9
5,1 3,0 3,0 4 8,0 2,828
1 1/9
5,2 3,5 3,5 3 4,5 2,121
0,5 1/9
5,5 5,0 5,0 0 0,0 0,0 1 1/9Média amostral 8/3 8/3 16/9 26/9 1,3 2/3Média populacional
8/3 2 4 26/9 1,7 2/3
Sem Viés Sim Não Não Sim Não Sim
Christopher Souza: Estimação de
parâmetros
12
Método dos Mínimos Quadrados• Estimação dos coeficientes de um modelo de
distribuição, e.g., ŷi=a+b.xi, para minimizar os quadrados das diferenças (ei) entre valores de frequências amostrais (yi) e estimadas por meio de funções densidade de probabilidades (ŷi).
• Estimativa de coeficientes a partir de valores de mínimas diferenças a partir de:
Christopher Souza: Estimação de
parâmetros
13
Método da Máxima Verossimilhança• Função de verossimilhança definida como a
probabilidade conjunta de obter coincidentemente/concomitantemente a melhor aproximação da função para a definição do coeficiente
• O valor do coeficiente que resulta nas melhores estimativas é obtido para um valor de máximo da função de verossimilhança, sendo estimado a partir do seu valor para quando a derivada é nula.
• É frequente o emprego do logaritmo
Christopher Souza: Estimação de
parâmetros
14
Método da Máxima Verossimilhança• A solução de funções de máxima verossimilhança
por vezes demanda esforço formidável• Uma alternativa tem sido a aplicação de soluções
iterativas que consistem em adequar a equação para uma expressão do tipo , quando originalmente se apresentava a equação
• A estratégia consiste em adotar valor para x e identificar quando (x) se aproxima de x, alterando o valor de x iterativamente.
Christopher Souza: Estimação de
parâmetros
15
f(x) = (x) – x
(x) = x
Comparação de métodos• Máxima verossimilhança sugere parâmetros
considerados mais eficientes. Para pequenos tamanhos de amostra, a qualidade do estimador é comparável ou inferior ao de outros métodos.
• Métodos dos momentos são mais simples, mas seus parâmetros apresentam qualidade inferior para funções com 3 ou mais parâmetros.
Christopher Souza: Estimação de
parâmetros
16
Caso em estudo: Paraná em Itaipú• Desenvolvido por Gláucia
Nascimento e Christopher Souza
• Séries de vazões naturais para anos hidrológicos de cheias entre 1962 e 2006
• Ajuste do modelo GEV a máximos anuais
• Uso da função “gevfit” para sugestão de valor inicial dos coeficientes
• Modificação dos coeficientes pela soma dos valores apresentados na legenda
1 1.5 2 2.5 3 3.5 4 4.5
x 104
0
10
20
30
40
50
60
70
80
90
100
Vazão
TR
Mudanças no Parâmetro 1
-1000
-500
-100
300
700
1000ppWeibull
GEV
Christopher Souza: Estimação de
parâmetros
17
Caso em estudo: Paraná em Itaipú
Christopher Souza: Estimação de
parâmetros
18
1 1.5 2 2.5 3 3.5 4 4.5
x 104
0
10
20
30
40
50
60
70
80
90
100
Vazão
TR
Mudança no parâmetro 2
-1000
-500
-100
300
700
1000ppWeibull
GEV
1 1.5 2 2.5 3 3.5 4 4.5 5
x 104
0
10
20
30
40
50
60
70
80
90
100
Vazão
TR
Mudança nos parâmetros 1 e
2
0
700
1300
1900
2500
3000ppWeibull
GEV
Intervalos de confiança
Christopher Souza: Estimação de
parâmetros
19
“Estamos 95% confiantes de que o intervalo ± E contém o valor de ”̂
Intervalos de confiança (proporção)• Requisitos:
▫ Amostra aleatória simples.▫ Condições para a
distribuição binomial satisfeitas.
▫ Haver pelo menos 5 sucessos e 5 fracassos, o que permite aproximar pela distribuição normal
• Associa-se um grau de confiança, e.g. 95%, de que o valor do parâmetro de proporção esteja inserido no intervalo construído a partir da proporção amostral
Christopher Souza: Estimação de
parâmetros
20
População Infinita Finita
Margem de Erro
Tamanho da Amostra
Intervalos de confiança(, para conhecido)• Requisitos:
▫ Amostra aleatória simples.
▫ Teorema do limite central (Normal se não houver outlier e histograma ~ forma de sino)
• Associa-se um grau de confiança, e.g. 95%, de que o valor do parâmetro de média esteja inserido no intervalo construído a partir da média amostral
Christopher Souza: Estimação de
parâmetros
21
População Infinita Finita
Margem de Erro
Tamanho da Amostra
Intervalos de confiança(, para desconhecido)• Requisitos:
▫ Amostra aleatória simples.
▫ Teorema do limite central (Normal se não houver outlier e histograma ~ forma de sino)
• Associa-se um grau de confiança, e.g. 95%, de que o valor do parâmetro de média esteja inserido no intervalo construído a partir da média amostral
Christopher Souza: Estimação de
parâmetros
22
• Margem de Erro▫ População infinita
▫ População finita
Intervalos de confiança (²)• Requisitos:
▫ Amostra aleatória simples.▫ Distribuição normal
mesmo para grandes amostras
• Associa-se um grau de confiança, e.g. 95%, de que o valor do parâmetro de variância esteja inserido no intervalo construído a partir da variância amostral
• Estima-se desvio populacional a partir da raiz da estimativa do parâmetro de variância
Christopher Souza: Estimação de
parâmetros
23
Bootstrap• Não tem pré-requisitos• Consiste na obtenção de
estatísticas amostrais de reamostragens de n valores da amostra com repetição
• Estima-se intervalos de confiança a partir do valor de percentis
• Exemplo de dados não-normais
• 2,9 564,2 1,4 4,7 67,6 4,8 51,3 3,6 18,0 3,6
• Exemplo de uma replicação
• 2,9 3,6 1,4 18,0 67,6 4,8 51,3 3,6 18,0 3,6
Christopher Souza: Estimação de
parâmetros
24