Autonomous Pricing using Policy-Gradient Reinforcement Learning


Autoria(s): Frick, Kevin Michael
Contribuinte(s)

Martello, Silvano

Denicolò, Vincenzo

Pastorello, Sergio

Data(s)

20/07/2022

Resumo

Nella letteratura economica e di teoria dei giochi vi è un dibattito aperto sulla possibilità di emergenza di comportamenti anticompetitivi da parte di algoritmi di determinazione automatica dei prezzi di mercato. L'obiettivo di questa tesi è sviluppare un modello di reinforcement learning di tipo actor-critic con entropy regularization per impostare i prezzi in un gioco dinamico di competizione oligopolistica con prezzi continui. Il modello che propongo esibisce in modo coerente comportamenti cooperativi supportati da meccanismi di punizione che scoraggiano la deviazione dall'equilibrio raggiunto a convergenza. Il comportamento di questo modello durante l'apprendimento e a convergenza avvenuta aiuta inoltre a interpretare le azioni compiute da Q-learning tabellare e altri algoritmi di prezzo in condizioni simili. I risultati sono robusti alla variazione del numero di agenti in competizione e al tipo di deviazione dall'equilibrio ottenuto a convergenza, punendo anche deviazioni a prezzi più alti.

Formato

application/pdf

Identificador

http://amslaurea.unibo.it/26306/1/KMF_MSc_Thesis.pdf

Frick, Kevin Michael (2022) Autonomous Pricing using Policy-Gradient Reinforcement Learning. [Laurea magistrale], Università di Bologna, Corso di Studio in Ingegneria informatica [LM-DM270] <http://amslaurea.unibo.it/view/cds/CDS0937/>

Idioma(s)

en

Publicador

Alma Mater Studiorum - Università di Bologna

Relação

http://amslaurea.unibo.it/26306/

Direitos

cc_by_nc_sa4

Palavras-Chave #reinforcement learning,computational economics,optimal control,policy gradient,deep learning,deep reinforcement learning,algorithmic collusion,multiagent reinforcement learning,marl,rl,drl,neural networks,learning,game theory #Ingegneria informatica [LM-DM270]
Tipo

PeerReviewed

info:eu-repo/semantics/masterThesis