[Back]


Diploma and Master Theses (authored and supervised):

I. Stoilkovska:
"XML Data Integration";
Supervisor: R. Pichler; Institut für Informationssysteme, 2014.



English abstract:
Since the publication of Codd´s paper, the relational databases have dominated the database
world and are still in wide use nowadays. With the advance of the Web technologies, the database
research community has oriented its focus on bridging the gap between the traditional ways of
storing data using relational databases and the novel techniques of transferring data on the Web.
XML has emerged as a standard for data transmission on the Web, by setting its main goal
to be providing a simple and efficient way of storing and transferring data. Problems such
as data integration, data exchange and answering queries using views have become a topic of
interest in recent years, and their formalization in an XML setting has received a significant
amount of attention. In this thesis, we propose a unified framework for analyzing and comparing
the features of a multitude of works that analyze these problems in the context of XML. We
introduce a query language for XML trees, called extended tree patterns, which allows us to
define XML mapping assertions that successfully capture the expressive power of the mapping
assertions used in a large subset of the works that we overview. We classify different approaches
based on the expressive power of their mapping assertions and point out the similarities and
differences along several criteria. Finally, we give an overview of the problems that have been
addressed so far, and identify which specific variants of the respective problems have not been
tackled yet.

German abstract:
Seit der Veröffentlichung von Codd´s Artikel haben relationale Datenbanken die Welt der Daten-
banken dominiert und ihre Verwendung ist auch heute noch weit verbreitet. Mit dem Aufkom-
men von Internet-Technologien hat die Datenbankforschung ihren Fokus darauf gelegt, die
Lücke zwischen traditionellen Arten der Datenspeicherung mittels relationaler Datenbanken
und neuen Techniken des Datentransfers über das Internet zu überbrücken. XML hat sich hi-
erbei als ein Standard zur Übermittlung von Daten über das Internet etabliert, da das Hauptziel
von XML in der Bereitstellung einfacher und effizienter Methoden der Datenspeicherung und
-übertragung liegt. Probleme wie die Integration von Daten, der Datenaustausch und die Beant-
wortung von Abfragen mit Hilfe von Sichten haben in den vergangenen Jahren großes Inter-
esse erweckt, und die Formalisierung dieser Probleme in XML hat viel Aufmerksamkeit er-
langt. In dieser Masterarbeit schlagen wir ein vereinheitlichtes Gerüst zur Analyse und zum
Vergleich von Eigenschaften einer Vielzahl von Werken, welche diese Probleme im Kontext
von XML analysieren, vor. Wir führen eine Abfrage-Sprache für XML-Bäume ein, sogenan-
nte ´extended tree patterns´, welche es uns erlauben ´xml mapping assertions´ zu definieren,
die wiederum erfolgreich die Ausdruckskraft der ´mapping assertions´ charakterisieren, welche
in einem Großteil der Arbeiten, die wir aufführen, verwendet werden. Wir klassifizieren ver-
schiedene Herangehensweisen, basierend auf der Ausdruckskraft ihrer ´mapping assertions´,
und zeigen Ähnlichkeiten und Unterschiede in Bezug auf eine Reihe von Kriterien auf. Letz-
tendlich geben wir einen Überblick über die bisher gelösten Probleme und heben hervor, welche
spezifischen Varianten der jeweiligen Probleme bisher noch nicht gelöst worden sind.

Keywords:
XML


Related Projects:
Project Head Reinhard Pichler:
Heterogene Information Integration


Created from the Publication Database of the Vienna University of Technology.