https://repositorio.ufjf.br/jspui/handle/ufjf/5907
File | Description | Size | Format | |
---|---|---|---|---|
renanmottagoulart.pdf | 495.01 kB | Adobe PDF | View/Open |
Type: | Dissertação |
Title: | Um método Kernel para estimativa de densidade e sua aplicação em jogos de repetição |
Author: | Goulart, Renan Motta |
First Advisor: | Fonseca Neto, Raul |
Referee Member: | Santos, Marcelo Costa Pinto e |
Referee Member: | Bernadino, Heder Soares |
Resumo: | Jogos de repetição é um ramo de Teoria dos Jogos, em que um jogo é jogado repetidas vezes pelos jogadores. Neste cenário, assume-se que os jogadores nem sempre jogam de modo ótimo ou podem estar dispostos, se possível, a colaborar. Neste contexto é possível um jogador analisar o comportamento dos oponentes para encontrar padrões. Estes padrões podem ser usados para aumentar o lucro obtido pelo jogador ou detectar se o oponente está disposto a realizar uma colaboração mutualmente benéfica. Nesta dissertação é proposto um novo algoritmo baseado em kernel de similaridade capaz de prever as ações de jogadores em jogos de repetição. A predição não se limita a ação do próximo round, podendo prever as ações de uma sequência finita de rounds consecutivos. O algoritmo consegue se adaptar rapidamente caso os outros jogadores mudem suas estratégias durante o jogo. É mostrado empiricamente que o algoritmo proposto obtém resultados superiores ao estado da arte atual. |
Abstract: | Repeated games is a branch of game theory, where a game can be played several times by the players involved. In this setting, it is assumed that the players do not always play the optimal strategy or that they may be willing to collaborate. In this context it is possible for a player to analyze the opponent’s behaviour to find patters. These patterns can be used to maximize the player’s profit or to detect if the opponent is willing to collaborate. On this dissertation it is proposed a new algorithm based on similarity kernel capable of predicting the opponent’s actions on repeated games. The prediction is not limited to the next round’s action, being able to predict actions on a finite sequence of rounds. It is able to adapt rapidly if the opponents change their strategies during the course of a game. It is shown empirically that the proposed algorithm achieves better results than the current state of the art. |
Keywords: | Teoria dos Jogos Jogos de repetição Previsão de sequências Estimativa de densidade Descida do gradiente Game theory Repeated games Sequence prediction Density estimate Gradient descent |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA |
Language: | por |
Country: | Brasil |
Publisher: | Universidade Federal de Juiz de Fora (UFJF) |
Institution Initials: | UFJF |
Department: | ICE – Instituto de Ciências Exatas |
Program: | Programa de Pós-graduação em Ciência da Computação |
Access Type: | Acesso Aberto |
URI: | https://repositorio.ufjf.br/jspui/handle/ufjf/5907 |
Issue Date: | 1-Sep-2017 |
Appears in Collections: | Mestrado em Ciência da Computação (Dissertações) |
Items in DSpace are protected by Creative Commons licenses, with all rights reserved, unless otherwise indicated.