Publication Entry

[Back]

Doctor's Theses (authored and supervised):

W. Hoschek:
"A Univied Peer-to-Peer Database Framework for XQueries over Dynamic Distributed Content and its Application for Scalable Service Discovery";
Supervisor, Reviewer: G. Kappel, E. Schikuta; Institut für Softwaretechnik und Interaktive Systeme, 2002.

English abstract:

In a large distributed system spanning administrative domains such as a Grid, it is desirable to maintain and query dynamic and timely information about active participants such as services, resources and user communities.

The web services vision promises that programs are made more flexible and powerful by querying Internet databases (registries) at runtime in order to discover information and network attached third-party building blocks. Services can advertise themselves and related metadata via such databases, enabling the assembly of distributed higher-level components. In support of this vision, this thesis shows how to support expressive general-purpose queries over a view that integrates autonomous dynamic database nodes from a wide range of distributed system topologies.

We motivate and justify the assertion that realistic ubiquitous service and resource discovery requires a rich general-purpose query language such as XQuery or SQL. Next, we introduce the Web Service Discovery Architecture (WSDA), which subsumes an array of disparate concepts, interfaces and protocols under a single semi-transparent umbrella. WSDA specifies a small set of orthogonal multi-purpose communication primitives (building blocks) for discovery. These primitives cover service identification, service description retrieval, data publication as well as minimal and powerful query support. The individual primitives can be combined and plugged together by specific clients and services to yield a wide range of behaviors and emerging synergies.

Based on WSDA, we introduce the hyper registry, which is a centralized database node for discovery of dynamic distributed content, supporting XQueries over a tuple set from an XML data model. We address the problem of maintaining dynamic and timely information populated from a large variety of unreliable, frequently changing, autonomous and heterogeneous remote data sources. However, in a large cross-organizational system, the set of information tuples is partitioned over many such distributed nodes, for reasons including autonomy, scalability, availability, performance and security. This suggests the use of Peer-to-Peer (P2P) query technology.

Consequently, we take the first steps towards unifying the fields of database management systems and P2P computing. As a result, we propose the WSDA based Unified Peer-to-Peer Database Framework (UPDF) and its associated Peer Database Protocol (PDP), which are unified in the sense that they allow to express specific applications for a wide range of data types (typed or untyped XML, any MIME type), node topologies (e.g. ring, tree, graph), query languages (e.g. XQuery, SQL), query response modes (e.g. Routed, Direct and Referral Response), neighbor selection policies, pipelining, timeout and other scope characteristics. The uniformity and wide applicability of our approach is distinguished from related work, which (1) addresses some but not all problems, and (2) does not propose a unified framework.

German abstract:

In einem mehrere Organisationen ¨uberspannenden, großen verteilten System, wie z.B. einem Grid, ist es wünschenswert dynamische und zeitsensitive Information über Netzwerkdienste, Ressourcen und Benutzer zu verwalten und abzufragen. Das Konzept der Webdienste verspricht flexible Programme die zur Laufzeit Internet Datenbanken (Registries) benutzen um Informationen und Netzwerkdienste von Drittanbietern zu finden. Dienste können sich und verwandte Metadaten durch derartige Datenbanken anbieten und so das Zusammenfügen von
höheren verteilten Komponenten ermöglichen.

Diese Dissertation unterstützt diese Vision indem sie zeigt, wie ausdrucksstarke Mehrzweckabfragen über eine Sicht formuliert werden können, die autonome dynamische Datenbankknoten von beliebigen Topologien integriert.

Wir motivieren und rechtfertigen die Behauptung, daß das Finden von Ressourcen und Diensten eine reiche Mehrzweckabfragesprache wie z.B. XQuery oder SQL verlangt. Wir führen die sogenannte Web Service Discovery Architecture (WSDA) ein, die disparate Konzepte, Schnittstellen und Netzwerkprotokolle unter einem quasi-transparenten Dach zusammenfaßt. WSDA spezifiziert eine kleine Menge von orthogonalen Mehrzweckfunktionen (Bausteinen) zum Finden von Diensten. Diese decken die Bereiche der Dienstidentifizierung, Dienstbeschreibung, Datenpublikation sowie minimale und mächtige Abfrageunterstützung ab. Clients und Server können diese Funktionen so kombinieren daß dabei eine breite Palette von Verhalten und Synergien ensteht. Basierend auf WSDA führen wir eine zentrale Datenbank für das Finden von dynamischen verteilten Daten ein, die Hyper Registry. Diese unterstützt XQueries über dynamische, zeitsensitive Daten, die von unzuverlässigen, sich häufig ändernden, autonomen und heterogenen Datenquellen stammen.

In einem mehrere Organisationen überspannenden, großen verteilten System jedoch sind die Datentupel über viele Knoten verteilt, z.B. aus Gründen der Autonomie, Skalierbarkeit, Verfügbarkeit, Effizienz und Sicherheit. Daher empfiehlt sich die Benützung von Peer-to-Peer (P2P) Abfragetechnologie. So unternehmen wir die ersten Schritte zur Vereinheitlichung von Datenbank Management Systemen und P2P Computing. Auf WSDA basierend schlagen wir das Unified Peer-to-Peer Database Framework (UPDF) und korrespondierende Peer Database Protocol (PDP) vor. Beide sind vereinheitlicht in dem Sinn daß innerhalb ihreres Rahmens spezifische Applikationen für eine Vielfalt von Datentypen, Knotentopologien, Abfragesprachen, Antwort-Modi, und verschiedene Formen der Nachbarschaftsauswahl, des Pipelining, und von Timeouts formuliert werden können.

Die Einheitlichkeit, breite Einsatzfähigkeit und Wiederverwendbarkeit unseres Ansatzes unterscheidet sich von verwandten Arbeiten die (1) einzelne aber nicht alle Probleme behandeln, und (2) keinen einheitlichen Rahmen einführen.

Electronic version of the publication:

http://www.big.tuwien.ac.at/research/publications/phdtheses/hoschek.pdf

Created from the Publication Database of the Vienna University of Technology.