[Back]


Doctor's Theses (authored and supervised):

M. Bögl:
"Visual Analysis of Periodic Time Series Data - Supporting Model Selection, Prediction, Imputation, and Outlier Detection Using Visual Analytics";
Supervisor, Reviewer: S. Miksch, P. Filzmoser, C. Turkay, R. Maciejewski; Technische Universität Wien | Fakultät für Informatik | Institut für Visual Computing and Human-Centered Technology | E193, 2020; oral examination: 2020-11-27.



English abstract:
Time series data are essential in many fields, like economics, natural sciences, and medicine, to name a few. Measuring and recording these data allow us to document, analyze, and make decisions. One of the most natural structures in time series across all areas is periodicity, which stems from either the natural phenomena measured or the underlying calendar structure. One finds the structural property of time in many of these time series by periodic reoccurrences. In a time series analysis, these properties are mostly beneficial, if identified correctly and modeled adequately, for tasks like model selection, prediction, imputation, and outlier detection. These periodic patterns can be obvious due to the context or hidden in the data itself. Visualization is one way for human perception to identify such patterns easily and allow for the exploration, identification, and investigation of such underlying patterns using visual analysis.

In this dissertation, we consider the different stages of time series analysis for periodic time series, starting with exploring the time series, selecting appropriate time series models, supporting the parametrization, examining the prediction performance, imputing missing values, and detecting outliers. For all these steps, we investigate how Visual Analytics can support users in these tasks and how intertwining new perspectives on periodic time series using visualization together with user perception, interaction techniques, and statistical computations fosters the user in analyzing periodic time series.

We first propose a Visual Analytics approach for supporting the whole process of selecting appropriate time series models, allowing the visual exploration of time series while guiding the model selection, parametrization, and model diagnostics. We then investigate how to integrate the prediction capabilities of the model into the model selection process. Next, we employ a cycle plot representation to support the imputation of missing values in periodic time series. Thereafter, we present a novel abstraction method to use a cycle plot representation for multivariate time series as well in order to use it for outlier detection in periodic time series. For each of the proposed solutions, we employed an iterative user-centered design process; we showed the utility of the approaches in usage scenarios and thoroughly illustrated walk-throughs. Furthermore, we discussed the implications of such methods and concluded with open challenges in these topics. Integrating additional focus on visualizing periodicity into the Visual Analytics approaches allows for better comprehending the applied models, predictions, imputations, and outliers. The results indicate that adequate visual representation and abstraction, when considering the periodic structure of time, allows for the analysis of time series from different perspectives and provides possibilities for identifying adequate time series models, supporting the imputation of missing values, and identifying outliers.

German abstract:
Zeitreihen sind in unterschiedlichen Forschungsbereichen präsent, sei es in Wirtschaft, Naturwissenschaften, Medizin und dergleichen mehr. Diese Art von Daten wird aufgezeichnet, um Messungen festzuhalten, zu analysieren und basierend darauf, Entscheidungen zu treffen. Periodizität ist eine Eigenschaft von Zeitreihen, die durch die natürliche Struktur der gemessenen Phänomene oder durch dahinterliegende Kalenderstrukturen bedingt ist. Diese strukturelle Eigenschaft der Zeit zeigt sich in vielen Datensätzen durch periodisch wiederkehrende Muster. Für die Analyse von Zeitreihen ist eben diese Eigenschaft von Vorteil, solange die Periodizität erkannt und richtig abgebildet wird. Dann kann sie helfen, passende Zeitreihenmodelle auszuwählen, Vorhersagen besser zu interpretieren, geschätzte fehlende Werte zu beurteilen und Ausreißer zu erkennen. Die periodischen Muster können direkt aus dem Zusammenhang der Daten gegeben oder in den Daten selbst versteckt sein. Um solche zu identifizieren, besteht eine Möglichkeit darin, sie mittels geeigneter visueller Darstellungen zu erkennen oder die Daten mithilfe von Visual Analytics zu explorieren, um die darunterliegenden Muster identifizieren und untersuchen zu können.

In der vorliegenden Dissertation werden verschiedenste Herausforderungen in der Zeitreihenanalyse betrachtet. Diese Herausforderungen betreffen im Speziellen periodische Zeitreihen und umfassen das Explorieren von Zeitreihen, die Auswahl möglichst passender Zeitreihenmodelle, die Unterstützung in der Parametrisierung, das Überprüfen der Vorhersagequalität der Modelle, das Berechnen und Ersetzen von fehlenden Werten sowie das Erkennen von Ausreißern. Für all diese Schritte wird die Anwendbarkeit von Visual Analytics-Methoden untersucht und es wird ermittelt, wie Nutzer*innen in diesen Aufgaben bestmöglich unterstützt werden können bzw. wie die Verflechtung neuer visueller Betrachtungswinkel auf periodische Zeitreihen gemeinsam mit menschlicher Wahrnehmung, mit Interaktionstechniken und mit statistischen Berechnungen, die herausfordernde Analyse von Zeitreihen positiv beeinflusst.

Als ersten Schritt stellen wir einen Visual Analytics-Ansatz vor, mit dem der gesamte Modellauswahlprozess unterstützt wird. Dazu ermöglicht der Ansatz die visuelle Analyse der Zeitreihe, bietet eine Orientierungshilfe für die Auswahl der Modelle und Modellparameter sowie für die genaue Diagnose bezüglich Angemessenheit der Modelle für die Daten. Weiters untersuchen wir die Zusammenführung der Vorhersagemöglichkeiten der gewählten Modelle und Modellparameter in den Modellauswahlprozess. Im nächsten Schritt verwenden wir eine spezielle Darstellungsform für periodische Zeitreihen (Zyklengraph bzw. cycle plot), um die Imputation, das heißt, die passenden Schätzungen von fehlenden Datenpunkten, zu verbessern und diese zu vervollständigen. Danach zeigen wir unter Verwendung einer neuartigen Datenabstraktion, wie dieser Zyklengraph mithilfe dieser Abstraktion für multivariate Zeitreihen konstruiert und für das Erkennen von Ausreißern in multivariaten periodischen Zeitreihen verwendet werden kann. Für jeden dieser vorgeschlagenen Ansätze wurden iterative nutzer*innenzentrierte Designprozesse verwendet sowie Nutzen und Anwendbarkeit der Ansätze durch Nutzer*innenszenarien und gründlich beschriebene Funktionalitätstests bestätigt. Abschließend werden die Auswirkungen dieser Ansätze beschrieben sowie offene Fragestellungen und weitere Forschungsmöglichkeiten diskutiert. Das Miteinbeziehen von vorhandener Periodizität in der visuellen Darstellung erlaubt bei Visual Analytics-Ansätzen ein besseres Verstehen und Nachvollziehen von angewandten Zeitreihenmodellen, von Vorhersagen, von Imputationen und Ausreißern. Die Forschungsergebnisse zeigen, dass diese visuellen Darstellungsformen gemeinsam mit der passenden Datenabstraktion bei gleichzeitiger Berücksichtigung der speziellen periodischen Struktur der Zeit für die Analyse von Zeitreihen andere Sichtweisen auf die Daten bieten. Damit wird die Auswahl angemessener Modelle bzw. Modellparameter, das Miteinbeziehen der Vorhersagemöglichkeiten im Modellauswahlprozess, die Imputation fehlender Werte sowie das Identifizieren von Ausreißern verbessert bzw. erst ermöglicht.

Keywords:
visual analytics; visual data science; information visualization; exploratory data analysis; statistics; time series analysis; periodic time; cycle plot; human-computer interaction


"Official" electronic version of the publication (accessed through its Digital Object Identifier - DOI)
http://dx.doi.org/10.34726/hss.2020.86301

Electronic version of the publication:
https://publik.tuwien.ac.at/files/publik_293853.pdf



Related Projects:
Project Head Silvia Miksch:
CVAST: Centre for Visual Analytics Science and Technology (Laura Bassi Centre of Expertise)

Project Head Silvia Miksch:
Visuelle Segmentierung und Labeling multivariater Zeitserien

Project Head Klaus Nordhausen:
CSTAT: Blind Source Separation


Created from the Publication Database of the Vienna University of Technology.