[Back]


Diploma and Master Theses (authored and supervised):

M. Gabriel:
"Distributed Factorization Machines for Next-Track Music Recommendation";
Supervisor: P. Knees; Institut für Information Systems Engineering, 2020; final examination: 2020-06-04.



English abstract:
Recommending the next tracks for a playlist or a users listening history is an important problem in music streaming platforms. Various approaches have been presented for this problem. Among them is matrix factorization which trains a model to recommend tracks of similar playlists or users. A common generalization of matrix factorization are factorization machines. They allow incorporating arbitrary features into the model and have not yet been evaluated in detail for next-track music recommendation. An evaluation carried out as part of this thesis shows that recommendations can be improved through the incorporation of features like, among others, user demographics, album, artist, the track year and the previous track. Since real-world systems have to handle millions of playlists, users and tracks and the factorization model can reach a remarkable size, a distributed training method is presented. This method allows the network-efficient distributed training of large factorization machine models which are themselves distributed over multiple machines. The method was implemented on top of Apache Spark and also evaluated.

German abstract:
Die automatische Empfehlungen von passenden nächsten Musikstücken für Playlists oder Nutzer ist ein wichtiges Problem in Musikstreaming-Plattformen. Für dieses Problem wurden bereits verschiedene Ansätze präsentiert, unter ihnen der Ansatz der Matrixfaktorisierung welcher ein Modell trainiert, das Musikstücke von ähnlichen Playlists oder Nutzern empfiehlt. Eine bekannte Generalisierung von Matrixfaktorisierung sind Faktorisierungsmaschinen. Diese erlauben die Aufnahme beliebiger Features in das Modell und wurden noch nicht im Detail für die Empfehlung passender Musikstücke evaluiert. Eine im Rahmen dieser Arbeit durchgeführte Evaluierung zeigt, dass durch die Nutzung von Faktorisierungsmaschinen und die Einbindung von Features wie Nutzerdemographie, Album, Künstler, Jahr des Musikstücks und vorheriges Musikstück eine Verbesserung der Empfehlungen erreicht werden kann. Da in realen Anwendungen Features von Millionen an Playlists, Nutzern und Musikstücken in das Modell eingebunden werden müssen und das Modell so eine beachtliche Größe erreichen kann, wird weiters eine Methode für ein verteiltes Training von solchen Modellen präsentiert. Durch eine bedeutende Reduktion des Netzwerkverkehrs wird ein effizientes verteiltes Training von über mehrere Maschinen verteilten großen Modellen möglich. Die präsentierte Methode wurde in Apache Spark implementiert und ebenfalls evaluiert.

Keywords:
Machine Learning; Distributed Machine Learning; Recommender Systems; Next-Track Music Recommendation; Playlist Continuation; Factorization Machines


Electronic version of the publication:
http://hdl.handle.net/20.500.12708/1118


Created from the Publication Database of the Vienna University of Technology.