Wdcc2011 Submission 6

download Wdcc2011 Submission 6

of 5

Transcript of Wdcc2011 Submission 6

  • 7/23/2019 Wdcc2011 Submission 6

    1/5

    Busca Estocstica Baseada em Planejamento para Maximizar

    Metas em Jogos de RTS

    Autor:Thiago Frana Naves1,

    Orientador: Carlos Roberto Lopes1

    1Programa de Ps-Graduao em Cincia da ComputaoUniversidade Federal do Uberlndia (UFU)

    Uberlndia MG Brasil

    [email protected], [email protected]

    Nvel: MestradoAno de ingresso no programa: 2010

    poca esperada de concluso: Abril / 2012Etapa concluda: Defesa da proposta de dissertao

    Resumo. Planejamento voltado para produo de recursos em jogos de estratgia

    em tempo real (RTS Games) apresenta uma grande quantidade de desafios, tais como

    restries temporais, efeitos numricos e satisfao de pr-condies para execuo

    de aes, caractersticas tpicas do domnio e importante objeto de estudo para a

    rea de pesquisa. Um jogo de RTS pode ser dividido em duas partes, a primeira

    onde o jogador procura reunir o mximo de recursos possveis a fim de alcanar

    um estado em que esses estejam maximizados, e a segunda onde ele utiliza desses

    recursos para combater o seu oponente. Com isso, a primeira parte do jogo torna-se

    de vital importncia para o sucesso do jogador e o foco deste trabalho, que tem por

    objetivo ir alm do desenvolvimento de um planejador de aes entre um estado iniciale um estado final pr-estabelecidos, e sim buscar qual o melhor estado objetivo a ser

    alcanado baseado nas propriedades do domnio. Para tais tarefas, ser utilizado o

    algoritmo Simulated Annealing junto com dois planejadores desenvolvidos para este

    trabalho.

    Palavras-Chave. Jogo RTS, recursos, planejamento, busca.

  • 7/23/2019 Wdcc2011 Submission 6

    2/5

  • 7/23/2019 Wdcc2011 Submission 6

    3/5

    2. Trabalhos Relacionados

    A pesquisa foi motivada inicialmente pelo trabalho [Fayard 2005], onde o autor busca estab-elecer uma maneira de avaliar se diferentes classes dentro de um mesmo jogo possuem seusrespectivos recursos balanceados em termos de custo e ganho para o jogador. Para tal, ele

    prope o uso do Simulated Annealing [Kirkpatrick et al. 1983] para encontrar o melhor con-junto de aes a serem alcanadas dado um conjunto de condies, entre essas est o tempomximo que o plano final pode obter, alm disso, o algoritmo trabalha com a funo objetivovoltada para maximizar a fora de ataque do plano final.

    Com a abordagem de [Fayard 2005], foi possvel vislumbrar uma forma de preencheruma lacuna encontrada em grande parte das abordagens sobre planejamento para Jogos RTS,pois essas buscam formas de obter planos entre estados iniciais e finais, mas no exploram qualseria o melhor estado final a ser alcanado dado um determinado momento do jogo e os recursosdisponveis nesse.

    Para completar a pesquisa os trabalhos de [Chan et al. 2008] e [Branquinho et al. 2011]

    deram as premissas necessrias para o desenvolvimento dos algoritmos que completam apesquisa. As duas abordagens buscam desenvolver um planejador que estabelea um planode aes dado dois estados um inicial e outro final, esse plano ento submetido a outro algo-ritmo que fica encarregado de escalonar as aes a fim de encontrar o menor tempo de execuopossvel para ele.

    Com os trabalhos relatados anteriormente, foi possvel estabelecer o corpo destapesquisa. As abordagens de [Chan et al. 2008] e [Branquinho et al. 2011] esto sendo usadaspara inspirar a construo dos planejadores utilizados, que tem a funo de estabelecer o con-junto de aes a serem executadas dado um limite mximo de tempo, alm de trazer essas aesj escalonadas. J a abordagem de [Fayard 2005] traz a ideia de aplicar uma meta-heurstica a

    fim de buscar maximizar algumas caractersticas desse plano obtido, tendo ao fim um resultadofinal timo em termos de fora e tempo de execuo do conjunto de aes, representando omelhor plano objetivo.

    3. Contribuio do Trabalho

    Diante dos desafios que envolvem o planejamento em jogos de RTS tais como: obteno de umplano de aes, escalonamento e principalmente a busca por melhorias no plano j estabelecidoatravs da insero e remoo de novas aes, as contribuies do trabalho buscam atingir todosesses segmentos de tarefas. As contribuies so:

    Desenvolvimento de um planejador sequencial linear. Desenvolvimento de um planejador de ordem parcial, que escalona as aes baseadonas restries do domnio de jogos de RTS.

    Desenvolvimento de um algoritmo de verificao que avalia a consistncia de um planode aes a cada vez que esse sofre uma operao do S.A.

    Anlise das possiblidades de representao e ordem das aes do plano para um melhorescalonamento

    Unio de duas abordagens diferentes de planejamento para a otimizao deste emdomnios com restrio de tempo, pr-condies e maximizao de funo objetivo.

    4. Metodologia e Estado da Pesquisa

    Para alcanar os objetivos desta pesquisa primeiramente foi feito um estudo sobre os principaistrabalhos de planejamento em jogos de RTS, para atravs destes obter a configurao atual das

  • 7/23/2019 Wdcc2011 Submission 6

    4/5

    pesquisas nesta rea afim de encontrar possveis espaos para contribuio. Em seguida, inici-amos a busca por algum tipo de simulador ou jogo de RTS que pudesse servir como ferramentade testes prticos para os resultados que seriam obtidos durante os experimentos.

    Dentre os modos de jogos e ferramentas de simulao pesquisadas, a que melhor atendeuas necessidades desta pesquisa foi a APIchamada Bwapi (Broodwar API) [Bwapi 2011], comela possvel introduzir algoritmos dentro do jogo Starcraft e dessa forma gerenciar e controlaro ambiente do jogo. A escolha da BWAPI est fortemente ligada ao fato da sua integrao como Starcraft, pois esse considerado um dos jogos de RTS mais completos e com maior nmerode restries e pr-condies entre seus recursos, validando ainda mais os resultados obtidos nodecorrer do trabalho.

    Dentre os algoritmos propostos para o trabalho o primeiro a ser desenvolvido foi oplanejador sequencial linear, que responsvel por encontrar um plano linear de aes dadoum determinado tempo limite. O plano gerado foi usado junto com o S.A. a fim de obter umconjunto de aes que aumentasse a fora de ataque desse, durante os experimentos foi notadoque o S.A. consegue em todos eles retornar um plano com fora de ataque maior que o iniciale esse novo plano possui tambm tempo menor de execuo, proporcionando outro ganho aoplanejamento.

    O segundo planejador foi desenvolvido baseado no principio de plano de ordem parciale tem por objetivo alm de desenvolver um plano de aes para alcanar um estado final dadoum determinado tempo, tambm o de escalonar essas aes. O escalonamento feito ao mesmotempo em que as aes vo sendo planejadas, e o planejador leva em conta diversas caracters-ticas presentes em domnios de jogos RTS para conseguir um escalonamento perto do melhorresultado possvel, como por exemplo: Antecipar a execuo de um recurso que contribui naobteno de mais recursos para o plano, no buscar escalonar recursos que so pr-condies de

    outros em sequncia, e sim em intervalos entre outros recursos. Esse plano de aes tambm submetido ao S.A a fim de encontrar um plano com fora de ataque maior e tempo de execuobaixo. Nos testes feitos at o momento o algoritmo consegue encontrar planos com fora deataque maximizado, mas nem sempre com o tempo final menor do que o do plano inicial.

    5. Cronograma do Trabalho at a Defesa

    Cronograma do Trabalho at a Defesa

    1. Implementao e testes com o plano parcial escalonado e S.A;2. Escrita de artigos cientficos ;

    3. Implementaes necessrias para otimizar os algoritmos;4. Testes com as implementaes desenvolvidas;5. Escrita da dissertao;

    Figura 1. Cronograma de atividades

  • 7/23/2019 Wdcc2011 Submission 6

    5/5

    Referncias

    Branquinho, A., Lopes, C. R., and Naves, T. F. (2011). Developing strategies for improvingplanning and scheduling of actions in rts games. 23rd IEEE International Conference onTools with Artificial Intelligence.

    Buro, M. and Furtak, T. (2003). Rts games as test-bed for real-time research. Workshop onGame AI, JCIS, 481-484.

    Bwapi (2011). BWAPI - An API for interacting with Starcraft : Broodwar.

    Chan, H., Fern, A., Ray, S., Ventura, C., and Wilson, N. (2008). Extending online planningfor resource production in real-time strategy games with search. Workshop on Planning inGames ICAPS.

    Chan, H., Fern, A., Ray, S., Wilson, N., and Ventura, C. (2007). Online planning for resourceproduction in real-time strategy games. In ICAPS.

    Fayard, T. (2005). Using a planner to balance real time strategy video game. Workshop onPlanning in Games, ICAPS 2007.

    Kirkpatrick, S., Gelatt, C. D., and Vecchi, M. P. (1983). Optimization by simulated annealing.Science 1983.