Publication Entry

[Back]

Contributions to Proceedings:

A. Krauck, D. Penz, M. Schedl:
"Team JKU-AIWarriors in the ACM Recommender Systems Challenge 2021: Lightweight XGBoost Recommendation Approach Leveraging User Features";
in: "RecSysChallenge 2021: RecSysChallenge '21: Proceedings of the Recommender Systems Challenge 2021", ACM, 2021, 39 - 43.

English abstract:

In this paper, we present the solution of team JKU-AIWarriors, submitted to the ACM Recommender Systems Challenge 2021 (http://www.recsyschallenge.com/2021). Our proposed model relies on features that we compute from user engagement counts. These counts are used to create compact user-specific features, which enables our model to make predictions swiftly. We adopt a simple XGB classifier, trained on a subset of the training data. To regularize during training, adding Gauss-distributed noise and randomly masking users helps to avoid overfitting.

Our submission achieved the 10th rank and an overall score of 21 in the final competition leaderboard, while taking less than a tenth of the average runtime of the nine better performing approaches. The proposed system, while being lightweight and computationally efficient, still performs reasonably on the task of predicting user interactions with microblogs, yielding a mean relative cross entropy of 13.12 and a mean average precision of 28.72% over all four prediction targets (like, retweet, reply, and quote). The code of our approach can be found at https://github.com/alexanderkrauck/RecSys2021.

German abstract:

In diesem Beitrag stellen wir die Lösung des Teams JKU-AIWarriors vor, die bei der ACM Recommender Systems Challenge 2021 (http://www.recsyschallenge.com/2021) eingereicht wurde. Unser vorgeschlagenes Modell stützt sich auf Merkmale, die wir aus der Anzahl der Nutzerinteraktionen berechnen. Diese Zählungen werden verwendet, um kompakte benutzerspezifische Merkmale zu erstellen, die es unserem Modell ermöglichen, schnell Vorhersagen zu treffen. Wir verwenden einen einfachen XGB-Klassifikator, der auf einer Teilmenge der Trainingsdaten trainiert wird. Um während des Trainings zu regulieren, fügen wir Gauß-verteiltes Rauschen hinzu und maskieren Nutzer nach dem Zufallsprinzip, um eine Überanpassung zu vermeiden.

Unsere Einreichung erreichte den 10. Platz und eine Gesamtpunktzahl von 21 in der abschließenden Rangliste des Wettbewerbs, während sie weniger als ein Zehntel der durchschnittlichen Laufzeit der neun leistungsstärkeren Ansätze benötigte. Das vorgeschlagene System ist zwar leichtgewichtig und recheneffizient, zeigt aber dennoch eine vernünftige Leistung bei der Vorhersage von Nutzerinteraktionen mit Mikroblogs. Es erzielte eine mittlere relative Kreuzentropie von 13,12 und eine durchschnittliche Genauigkeit von 28,72 % für alle vier Vorhersageziele (Like, Retweet, Reply und Quote). Der Code unseres Ansatzes ist unter https://github.com/alexanderkrauck/RecSys2021 zu finden.

Keywords:

datasets, recommender-system, user-based, xgb, lightweight

"Official" electronic version of the publication (accessed through its Digital Object Identifier - DOI)

http://dx.doi.org/10.1145/3487572.3487874

Electronic version of the publication:

https://dl.acm.org/doi/abs/10.1145/3487572.3487874

Created from the Publication Database of the Vienna University of Technology.