Métodos de aceleração da aprendizagem
-
Upload
luis-nunes -
Category
Documents
-
view
876 -
download
2
Transcript of Métodos de aceleração da aprendizagem
Aprendizagem Automática
Mestrado em Engenharia Informática
13-04-2023 Aprendizagem Automática / Machine Learning
Sumário
Métodos de aceleração
2
13-04-2023 Aprendizagem Automática / Machine Learning
Aceleração de Algoritmos Genéticos
Começar com pequenas populações / testes para eliminar rapidamente casos de espécimes inapropriados e focar zonas "interessantes"
Usar apenas mutação Usar conhecimento específico do
problema para minimizar a possibilidade de espécimes inapropriados 3
13-04-2023 Aprendizagem Automática / Machine Learning
Aceleração de RL
Backward experience replay (Lin 92)
Shaping (Randløv & Alstrøm, 1998), (Selfridge et
al., 1985), (Matari´c, 1997), (Ng et al. 1999)
4
13-04-2023 Aprendizagem Automática / Machine Learning
Aceleração Aprendizagem Supervisionada
Boosting (Kearns 88) Can a set of weak learners create a single strong
learner? Vários modelos ("aprendedores") "fracos" Adicionados com um peso associado Exemplos mal classificados tornam-se mais importantes
para o erro em cada iteração
Bagging - Bootstrap aggregating: (Breiman 96) Selecciona aleatoriamente subconjuntos de dados, Treina com vários "aprendedores", Classifica por votação.
5
Termo de momento (momentum) Duas vezes na mesma direcção, acelera, Em direcções contrárias, trava (ou não é
usado). Valor típico: 0.8
Aceleração de Backprop
)( ,1,,,1 ijtijtijtijt wwww
x
ijijt xw ,
A mesma taxa de aprendizagem para todos os pesos faz com que se mova com a mesma “velocidade” em todas as direcções
Solução: taxas de aprendizagem diferentes para cada peso
Aceleração de Backprop
ALR (Adaptive Learning Rates):
Aceleração de Backprop
x
ijijt xw , ijtijtijt www ,,,1
x
ijijt xw , ijtijtijtijt www ,,,,1
Ec
wwd
wwu
ijt
ijtijtijt
ijtijtijt
ijt
,
0,
0,
,
,,,
,,,
,
5.01
8.01
2.11
c
d
u
13-04-2023 Aprendizagem Automática / Machine Learning
Referências
(Whitehead 91) Whitehead, S. D. (1991). A complexity analysis of cooperative mechanisms in reinforcement learning. Proc. of the 9th National Conf. on AI (AAAI-91), pp. 607–613.
(Lin 92) Lin, L.-J. (1992). Self-improving reactive agents based on reinforcement learning, planning and teaching. Machine Learning, 8, 293–321.
F. M. Silva and L. B. Almeida, "Acceleration Techniques for the Backpropagation Algorithm", in L. B. Almeida and C. J. Wellekens (eds.), Neural Networks, Springer-Verlag, 1990.
9
13-04-2023 Aprendizagem Automática / Machine Learning
Referências
Randløv, J., & Alstrøm, P. (1998). Learning to drive a bicycle using reinforcement learning and shaping. Proceedings of the 15th International Conference on Machine Learning (pp. 463.471).
Selfridge, O., Sutton, R. S., & Barto, A. G. (1985). Training and tracking in robotics. Proceedings of the Ninth International Joint Conference on Articial Intelligence (pp. 670.672).
Matari´c, M. (1997). Reinforcement learning in the multirobot domain. Autonomous Robots, 4, 73.83.
Ng, A., Harada, D., & Russell, S. (1999). Policy invariance under reward transformations: theory and application to reward shaping. Proceedings of the 16th International Conference on Machine Learning (pp. 278.287).
10
13-04-2023 Aprendizagem Automática / Machine Learning
Referências
(Kearns 88) Michael Kearns. Thoughts on hypothesis boosting. Unpublished manuscript. 1988
(Schapire 90) Rob Schapire. Strength of Weak Learnability. Machine Learning Vol. 5, pages 197-227. 1990
(Breiman 96) Breiman, L., Bagging Predictors, Machine Learning, 24(2), pp.123-140, 1996.
11
13-04-2023 Aprendizagem Automática / Machine Learning
Sumário
Métodos de aceleração e melhoria de resultados em Aprendizagem Supervisionada e por Reforço
12