Browsing by Author "Dias, Augusto Vicente Fernandes"
Now showing 1 - 2 of 2
Results Per Page
Sort Options
- Estudo de aprendizagem por reforço em jogo Tower DefensePublication . Dias, Augusto Vicente Fernandes; Lopes, Rui Pedro; Foleiss, Juliano HenriqueA aprendizagem por reforço está revolucionando a inteligência artificial, isso representa que sistemas autônomos estão compreendendo cada vez mais o mundo visual. A aprendizagem por reforço é uma das abordagens de aprendizagem de máquina que funciona alterando o comportamento do agente por meio de feedbacks, como recompensas ou penalidades por suas ações. Trabalhos recentes utilizam aprendizagem por reforço para treinar agentes capazes de jogar jogos eletrônicos e obter pontuações até mais altas que jogadores humanos profissionais. As aplicações para agentes inteligentes em jogos incluem propiciar desafios mais complexos aos jogadores, melhorar a ambientação dos jogos proporcionando interações mais complexas e até servem como forma de prever o comportamento dos jogadores quando o jogo está em fase de desenvolvimento. A maioria dos trabalhos atuais, derivados de uma arquitetura conhecida como rede Q profunda, trabalham usando técnicas de aprendizagem profunda para processar a imagem do jogo, criando uma representação intermediária. Esta representação é, então, processada por camadas de rede neural capazes de mapear situações do jogo em ações que visam maximizar a recompensa ao longo do tempo. Entretanto, este método é inviável em jogos modernos, renderizados em alta resolução com taxa de quadros cada vez maior. Além disto, este método não funciona para treinar agentes que não estão mostrados na tela. Desta forma, neste trabalhos propomos um pipeline de aprendizagem por reforço baseado em redes neurais cuja entrada são metadados fornecidos diretamente pelo jogo e as ações são mapeadas diretamente em ações de alto-nível do agente. Propomos esta arquitetura para um agente jogador de defesa de torre, um jogo de estratégia em tempo real cujo agente não é representado na tela diretamente.
- Reinforcement Learning in Tower DefensePublication . Dias, Augusto Vicente Fernandes; Foleiss, Juliano Henrique; Lopes, Rui PedroReinforcement learning is a machine learning technique that makes a decision based on a sequence of actions. This allows changing a game agent’s behavior through feedback, such as rewards or penalties for their actions. Recent work has been demonstrating the use of reinforcement learning to train agents capable of playing electronic games and obtain scores even higher than professional human players. These intelligent agents can also assume other roles, such as creating more complex challenges to players, improving the ambiance of more complex interactive games and even testing the behavior of playerswhen the game is in development. Some literature has been using a deep learning technique to process an image of the game. This is known as the deep Q network and is used to create an intermediate representation and then process it by layers of neural network. These layers are capable of mapping game situations into actions that aim to maximize a reward over time. However, this method is not feasible in modern games, rendered in high resolution with an increasing frame rate. In addition, this method does not work for training agents who are not shown on the screen. In this work we propose a reinforcement learning pipeline based on neural networks, whose input is metadata, selected directly in the game state, and the actions are mapped directly into high-level actions by the agent.We propose this architecture for a tower defense player agent, a real time strategy game whose agent is not represented on the screen directly.