[Back]


Doctor's Theses (authored and supervised):

G. Reif:
"WEESA - Web Engineering for Semantic Web Applications";
Supervisor, Reviewer: H. Gall, M. Jazayeri; Institut für Informationssysteme, 2005.



English abstract:
In the last decade the increasing popularity of the World Wide Web has lead to an exponential growth in the number of pages available on the Web. This huge number of Web pages makes it increasingly difficult for users to find required information. In searching the Web for specific information, one gets lost in the vast number of irrelevant search results and may miss relevant material. Current Web applications provide Web pages in HTML format representing the content in natural language only and the semantics of the content is therefore not accessible by machines. To enable machines to support the user in solving information problems, the Semantic Web proposes an extension to the existing Web that makes the semantics of the Web pages machine-processable. The semantics of the information of a Web page is formalized using RDF meta-data describing the meaning of the content. The existence of semantically annotated Web pages is therefore crucial in bringing the Semantic Web into! existence.

Semantic annotation addresses this problem and aims to turn human-understandable content into a machine-processable form by adding semantic markup. Many tools have been developed that support the user during the annotation process. The annotation process, however, is a separate task and is not integrated in the Web engineering process. Web engineering proposes methodologies to design implement and maintain Web applications but these methodologies lack the generation of meta-data.

In this thesis we introduce a technique to extend existing XML-based Web engineering methodologies to develop semantically annotated Web pages. The novelty of this approach is the definition of a mapping from XML Schema to ontologies, called WEESA, that can be used to automatically generate RDF meta-data from XML content documents. We further demonstrate the integration of the WEESA meta-data generator into the Apache Cocoon Web development framework to easily extend XML-based Web applications to semantically annotated Web application.

Looking at the meta-data of a single Web page gives only a limited view of the of the information available in a Web application. For querying and reasoning purposes it is better to have the full meta-data model of the whole Web application as a knowledge base at hand. In this thesis we introduce the WEESA knowledge base, which is generated at server side by accumulating the meta-data from individual Web pages. The WEESA knowledge base is then offered for download and querying by software agents.

Finally, the Vienna International Festival industry case study illustrates the use of WEESA within an Apache Cocoon Web application in real life. We discuss the lessons learned while implementing the case study and give guidelines for developing Semantic Web applications using WEESA.

German abstract:
Die wachsende Popularität des World Wide Webs hat zu einer exponentiellen Steigerung der Zahl der Webseiten geführt. Die große Anzahl der verfügbaren Webseiten macht es Benutzern immer schwerer benötigte Informationen zu finden. Sucht man im Web nach einer spezifischen Information, läuft man Gefahr, die relevanten Daten in der großen Anzahl von irrelevanten Suchergebnissen
zu übersehen. Web-Applikationen stellen derzeit Webseiten in HTML Format zur
Verfügung, in denen der Inhalt in natürlicher Sprache ausgedrückt ist. Daher ist die Semantik des Inhalts für Computer nicht zugängig. Um es Computern zu ermöglichen dem Benutzer bei Informationsproblemen zu unterstützen, schlägt das Semantik Web eine Erweiterung des existierenden Webs vor, welche die Semantik der Webseiten f ür Computer verarbeitbar macht. Die Semantik des Inhalts einer Webseite wird dabei mit RDF Meta-Daten beschrieben. Diese Meta-Daten beschreiben den Inhalt der Webseite in einer maschinen-verarbeitbaren Form. Die Existenz von semantisch annotierten Webseiten ist daher die Voraussetzung für das Semantik Web.

Semantische Annotation beschäftigt sich mit diesem Problem und zielt darauf ab, semantische Meta-Daten zu natürlichsprachigen Dokumenten hinzuzufügen, um den Inhalt maschinenverarbeitbar zu machen. Viele Werkzeuge wurden entwickelt, um den Benutzer beim Annotierungsprozess zu unterstützen. Der Annotierungsprozess ist jedoch immer noch ein eigenständiger Prozess der nicht in den Entwicklungsprozess der Web-Applikation integriert ist. Auf der anderen Seite hat die Forschung im Bereich von Web Engineering zu Methoden geführt, um Web-Applikationen zu entwickeln und zu warten. Die vorgeschlagen Methoden unterstützen jedoch nicht das hinzufügen von semantischen Meta-Daten.

Diese Dissertation stellt eine Technik vor, um existierende XML-basierte Web Entwicklungsmethoden zu erweitern, um semantisch annotierte Webseiten zu erzeugen. Die Innovation des vorgestellten Ansatzes, genannt WEESA, ist die Verknüpfung von Elementen aus einem XML Schema mit den Konzepten die in einer Ontologie definiert sind. Diese Verknüpfung wird dann verwendet um aus XML-Dokumenten RDF Meta-Daten zu generieren. Weiters stellen wir die Integration des WEESA Meta-Daten Generators in die Apache Cocoon Webentwicklungsumgebung vor, das die Entwicklung von semantisch annotierten Webapplikationen erleichtert.

Betrachtet man nur die Meta-Daten einer einzelnen Webseite, hat man nur eine eingeschränkte Sicht auf die Meta-Daten die die Web-Applikation zur Verfügung stellt. Für Anfragen und logische Schlüsse ist es besser man hat die vollständigen Meta-Daten der ganzen Web-Applikation zur Verfügung. In dieser Dissertation stellen wir die WEESA Wissensbasis vor. Diese Wissensbasis wir serverseitig durch das Akkumulieren der Meta-Daten der individuellen Webseiten erzeugt und steht dann für Anfragen und zum Herunterladen zur Verfügung.

Die Wiener Festwochen Fallstudie zeigt den praktischen Einsatz von WEESA in einer Apache Cocoon Web-Applikation. Wir diskutieren die Erfahrungen aus der Entwicklung der Fallstudie und präsentieren Richtlinien zum Entwickeln von semantisch annotierten Web Applikationen mit WEESA.


Electronic version of the publication:
http://www.infosys.tuwien.ac.at/Staff/greif/weesa.pdf


Created from the Publication Database of the Vienna University of Technology.