[Zurück]


Dissertationen (eigene und begutachtete):

P. Wetz:
"Semantic Stream Processing of Environmental Data";
Betreuer/in(nen), Begutachter/in(nen): A. Tjoa, A. Frank; Fakultät für Informatik, 2016; Rigorosum: 08.09.2016.



Kurzfassung deutsch:
Da seit 2008 mehr als die Hälfte der Weltbevölkerung in urbanen Gegenden lebt, wird zu einem großen Teil in den Städten entschieden werden, ob wir die globalen Umweltprobleme lösen. Gleichzeitig wurde in der Wissenschaft in den letzten Jahren die Anwendung von Methoden der Informatik, um Umweltprobleme zu lösen, mehr und mehr erfolgversprechend. In dieser Arbeit stellen wir ein Verfahren vor, das das Ziel verfolgt, es BürgerInnen zu ermöglichen, gut informierte Entscheidungen auf Basis von Echtzeit-Umweltdaten zu treffen, um so zur Problemlösung beitragen zu können. Damit dieses Ziel erreicht werden kann, müssen Herausforderungen wie (i) die Integration von heterogenen Umweltdaten, (ii) die Identifikation adäquater Datenstrom-Management Systeme und (iii) das Design eines Systems zur effizienten Nutzung von Umwelt-Datenströmen durch städtische Interessensgruppen, gemeistert werden. Wir schlagen eine ontologie-basierte Methode vor, damit die stark heterogenen Umweltdaten integriert werden können. Zu diesem Zwecke, führen wir ein neuartiges Vokabular ein, das zwei de-facto Standards, nämlich die Semantic Sensor Network Ontology und das RDF Data Cube Vocabulary, kombiniert und erweitert. Um Datenstrom-Management Systeme zu evaluieren, erstellen wir ein Rahmenwerk namens YABench, das es erlaubt, verschiedene RDF Stream Processing (RSP) Systeme auf Basis unterschiedlicher Simulationsszenarien zu vergleichen. Dabei verwenden wir Parameter und Messzahlen, die vor allem im Umweltbereich wichtig sind, wie hochfrequente Messdaten, Korrektheit der Resultate (Precision und Recall), sowie Leistungsfähigkeit der Systeme (Speicherverbrauch und CPU-Belastung). YABench unterstützt somit die Entscheidung, geeignete RSP Systeme für unterschiedliche Umweltdaten-Szenarien zu ermitteln. Nachdem durch YABench C-SPARQL als passendes System identifiziert wird, stellen wir darauf aufbauend das Konzept "Linked Streaming Widgets" vor. Linked Streaming Widgets sind semantische Bausteine, die Streaming-Daten verarbeiten und von Anwendern zu Applikationen, sogenannten Mashups, zusammengesetzt werden können. Anwender können so Umwelt-Streaming-Daten integrieren und mit anderen Datenquellen verknüpfen, um letztendlich wohl-informierte Entscheidungen zu treffen. Wir setzen dieses Konzept als Erweiterung einer Mashup-Platform um. Des Weiteren präsentieren und diskutieren wir zwei Anwendungsfälle auf Basis von Citybike-Daten und Luftgütedaten und zeigen so die Durchführbarkeit des Konzepts. Eine abschließend durchgeführte Evaluierung demonstriert weiters die Praktikabilität der technischen Implementierung von Linked Streaming Widgets.

Kurzfassung englisch:
Whether we cope successfully or fail to deal with the world´s environmental challenges will be determined in cities where, since 2008, more than half of the global population resides. Recently, also the application of computer science methods to solve environmental issues is increasingly promising. In this thesis we present an approach to enable citizens to make well-informed real time decisions based on environmental data. To this end, we leverage semantic web technologies as a practical means to overcome the obstacles of (i) environmental data integration, (ii) identifying data stream management engines to process real time environmental data, and (iii) enabling efficient use of environmental data streams for city stakeholders. We develop an ontology-based approach to integrate highly heterogeneous and dynamic environmental data sources. We present a novel vocabulary that combines and extends two de-facto standard vocabularies, that is, the Semantic Sensor Network Ontology and the RDF Data Cube Vocabulary. Further, we create a framework to evaluate suitable RDF Stream Processing (RSP) engines based on the special requirements of the environmental data domain, such as processing of highfrequency data, providing correct results, and scalability. This framework called YABench facilitates the identification of appropriate RSP engines under varying circumstances for scenarios in the environmental domain. After we identify C-SPARQL as a suitable RSP engine, we propose "Linked Streaming Widgets". Linked Streaming Widgets represent lightweight semantic modules based on stream data, which can be combined to web applications by end users. By doing so, users can author their own mashups integrating environmental stream data sources, ultimately supporting well-informed decision making. We implement this concept as an extension of a mashup platform. To demonstrate its feasibility, we present and discuss two use cases based on citybike and air quality data, respectively, and perform performance evaluations indicating the practicability of Linked Streaming Widgets.

Schlagworte:
Semantik, Umweltdaten, Datenströme

Erstellt aus der Publikationsdatenbank der Technischen Universität Wien.