Please use this identifier to cite or link to this item: https://repositorio.ufjf.br/jspui/handle/ufjf/4771
Files in This Item:
File Description SizeFormat 
matheusribeirofurtadodemendonca.pdf1.06 MBAdobe PDFThumbnail
View/Open
Type: Dissertação
Title: Evolution of reward functions for reinforcement learning applied to stealth games
Author: Mendonça, Matheus Ribeiro Furtado de
First Advisor: Fonseca Neto, Raul
Co-Advisor: Bernardino, Heder Soares
Referee Member: Oliveira, Rafael Sachetto
Referee Member: Leite, Saul de Castro
Resumo: Muitos jogos modernos apresentam elementos que permitem que o jogador complete certos objetivos sem ser visto pelos inimigos. Isso culminou no surgimento de um novo gênero chamado de jogos furtivos, onde a furtividade é essencial. Embora elementos de furtividade sejam muito comuns em jogos modernos, este tema não tem sido estudado extensivamente. Este trabalho aborda três problemas distintos: (i) como utilizar uma abordagem por aprendizado de máquinas de forma a permitir que o agente furtivo aprenda como se comportar adequadamente em qualquer ambiente, (ii) criar um método eficiente para planejamento de caminhos furtivos que possa ser acoplado à nossa formulação por aprendizado de máquinas e (iii) como usar computação evolutiva de forma a definir certos parâmetros para nossa abordagem por aprendizado de máquinas. É utilizado aprendizado por reforço para aprender bons comportamentos que sejam capazes de atingir uma alta taxa de sucesso em testes aleatórios de um jogo furtivo. Também é proposto uma abor dagem evolucionária capaz de definir automaticamente uma boa função de reforço para a abordagem por aprendizado por reforço.
Abstract: Many modern games present stealth elements that allow the player to accomplish a certain objective without being spotted by enemy patrols. This gave rise to a new genre called stealth games, where covertness plays a major role. Although quite popular in modern games, stealthy behaviors has not been extensively studied. In this work, we tackle three different problems: (i) how to use a machine learning approach in order to allow the stealthy agent to learn good behaviors for any environment, (ii) create an efficient stealthy path planning method that can be coupled with our machine learning formulation, and (iii) how to use evolutionary computing in order to define specific parameters for our machine learning approach without any prior knowledge of the problem. We use Reinforcement Learning in order to learn good covert behavior capable of achieving a high success rate in random trials of a stealth game. We also propose an evolutionary approach that is capable of automatically defining a good reward function for our reinforcement learning approach.
Keywords: Planejamento de caminhos furtivos
Aprendizado por reforço
Algoritmos genéticos
Evolução de funções de reforço
Stealthy Path Planning
Reinforcement Leaning
Genetic Algorithms
Evolution of Reward Functions
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Language: por
Country: Brasil
Publisher: Universidade Federal de Juiz de Fora (UFJF)
Institution Initials: UFJF
Department: ICE – Instituto de Ciências Exatas
Program: Programa de Pós-graduação em Ciência da Computação
Access Type: Acesso Aberto
URI: https://repositorio.ufjf.br/jspui/handle/ufjf/4771
Issue Date: 2016
Appears in Collections:Mestrado em Ciência da Computação (Dissertações)



Items in DSpace are protected by Creative Commons licenses, with all rights reserved, unless otherwise indicated.