[Back]


Doctor's Theses (authored and supervised):

R. Fayzrakhmanov:
"Web Accessibility for the Blind Through Visual Representation Analysis";
Supervisor, Reviewer: R. Pichler, A. Provetti; Institut für Informationssysteme, 2014.



English abstract:
One of the most important attributes of a civilized society is based on the principle of equal op-
portunities for self-development and self-actualization within one´s life. In today´s contemporary
information society, this principle can be realized by enhancing the accessibility of information
resources for various groups of the population. Information is an inalienable part of today´s
life. This fact is clearly evident in the ongoing development and expansion of the World Wide
Web (the Web)-a huge information platform that has provided vast opportunities for people
by making it possible to effectively solve various tasks in business, education, science, and our
everyday lives. With the help of the Web, a person can pay bills, buy products and services,
complete university degrees online, search for and read articles, keep contact with their friends
and so much more.
However, these opportunities are not available for everybody. For example, people who
are blind encounter a lot of problems surfing the Web. This is a direct result of the majority
of web pages being orientated at sighted users and not taking into account users who are blind.
Blind users perceive the world differently and therefore need effective mechanisms for navigation
through the elements on a web page and the thorough understanding of their semantic role in
order to obtain an overview of a page in a few moments and perform a search. Current approaches
provide us with limited solutions in the pursuit of particular goals such as web page segmentation
or text summarization. Moreover, most approaches consider non-visual web page representations,
such as source code (X/HTML and XML) and tree representations (the tag tree and DOM tree)
which do not reflect the semantics that is analyzed by sighted users and posed exclusively on the
rendered web page. This fact explains the limitations of such methods.
The goal of this thesis is to enhance the accessibility of web pages for blind users. In
order to achieve this goal, we propose a complex solution covering the problems of automatic
understanding of a web page´s functional elements on the rendered web pages and navigation.
Firstly, we provide the means for web page analysis and understanding on the visual level which
carries the main information presented not only by the textual content, but also by the layout,
styles and other visual characteristics perceivable by sighted users. Secondly, the challenges in
improving web mobility of blind users based on the recognized logical elements of a web page
are considered in detail and solutions are proposed.
Considering the complexity in the analysis of visual characteristics, close attention is payed to
the modeling of a web page´s visual features defined in the Unified Ontological Model (UOM) as
well as developing methods and techniques for querying the model and approaches for realizing
methods for web page understanding and information extraction. The uniqueness of the Unified
Ontological Model (UOM) is based on its integration of different aspects of a web page in one
consistent model, such as geometry of the layout with quantitative and qualitative characteristics,
interface with different functional elements and structures, and the DOM tree. The proposed
cross-platform framework, Web Page Processing System (WPPS), ensures an efficient generation
of the UOM according to the provided configuration and conveys an application programming
interface (API) for developing methods and algorithms of web page processing. The WPPS
demonstrated its effectiveness in developing methods of web page segmentation, web object
identification and information extraction. For enhancing web accessibility based on the identified
web page elements, the Multi-Axial Navigation Model (MANM) and navigation methodology are
proposed in this thesis. Blindzilla, a cross-platform system which demonstrated its effectiveness
in an evaluation with blind users, implements these concepts.
Angesichts der Komplexität der Analyse der visuellen Eigenschaften liegt ein Hauptaugen-
merk dieser Dissertation auf der Modellierung der visuellen Merkmale einer Webseite nach dem
Unified Ontological Model (UOM) und der Entwicklung von Methoden und Techniken zum
Abfragen des Modells und von Zugängen zur Realisierung von Methoden für das Verstehen von
Webseiten und der darauf basierenden Extraktion von Informationen. Die Einzigartigkeit des
UOM besteht in der Integration verschiedener Aspekte einer Webseite, wie etwa der Geometrie
des Layouts mit quantitativen und qualitativen Eigenschaften, Schnittstellen mit verschiedenen
funktionellen Elementen und Strukturen und dem DOM-Knotenbaum in einem konsistenten Mo-
dell. Der vorgeschlagene plattformübergreifende Rahmen, Web Page Processing System (WPPS),
sichert eine effiziente Generierung des UOM laut der spezifizierten Konfiguration und stellt dem
Programmierer eine Schnittstelle zur Anwendungsprogrammierung (Application Programming
Interface - API) zur Entwicklung von Methoden und Algorithmen der Webseitenverarbeitung zur
Verfügung. Das WPPS hat seine Effizienz bei der Entwicklung von Methoden zur Webseitenseg-
mentierung, Webobjektidentifikation und Informationsextraktion bewiesen. Zur Verbesserung des
Internetzugangs auf der Basis von identifizierbaren Webseitenelementen schlägt diese Dissertati-
on das multiaxiale Navigationsmodell (MANM) und die multiaxiale Navigationsmethode vor.
Ein plattformübergreifendes System, Blindzilla, das seine Effizienz in der Evaluation mit blinden
BenutzerInnen gezeigt hat, setzt diese Konzepte um.

German abstract:
Chancengleichheit bei selbständiger Entwicklung und Aktualisierung für alle ist ein wichti-
ges Merkmal zivilisierter Gesellschaften. In der heutigen Informationsgesellschaft findet dieser
Aspekt eine seiner Umsetzungen in der Verbesserung des Zugangs verschiedener Bevölkerungs-
gruppen zu Informationsressourcen. Information ist ein unabdingbarer Teil des heutigen Lebens.
Diese Tatsache verdeutlicht die laufende Entwicklung und Expansion des World Wide Web (des
Internets) - einer riesigen Informationsplattform, die für Menschen große Chancen eröffnet hat,
indem sie die effiziente Lösung von Aufgaben im Geschäftsleben, in der Bildung, der Wissen-
schaft und in unserem täglichen Leben ermöglicht. Mit Hilfe des Internets kann man Rechnungen
bezahlen, Produkte und Dienstleistungen kaufen, an einer Fernuniversität studieren, nach Artikeln
suchen und sie lesen, Kontakt mit FreundInnen halten und vieles mehr.
Diese Möglichkeiten stehen jedoch nicht allen offen. Zum Beispiel sind blinde Menschen
beim Surfen im Internet mit vielen Problemen konfrontiert. Dies liegt an der Orientierung der
überwiegenden Mehrheit von Webseiten an sehenden BenutzerInnen, ohne Berücksichtigung von
blinden BenutzerInnen. Blinde BenutzerInnen nehmen die Welt anders wahr und benötigen daher
effiziente Mechanismen zur Navigation durch die Elemente einer Webseite und zum Verstehen von
deren semantischer Rolle, um in kurzer Zeit einen Überblick über eine Seite zu bekommen und
diese durchsuchen zu können. Aktuelle Zugänge bieten eingeschränkte Lösungen, die bestimmte
Ziele verfolgen, seien diese die Segmentierung von Webseiten oder Textzusammenfassungen
etc. Zudem muss erwähnt werden, dass die meisten Zugänge sich auf nichtvisuelle Webseiten-
darstellungen wie den Quellcode (X/HTML und XML) und Baumdarstellungen (Tag-Baum
oder DOM-Knotenbaum) beziehen, die nicht die Semantik wiederspiegeln, die von sehenden
BenutzerInnen analysiert und ausschließlich auf der dargestellten Webseite abgebildet wird. Diese
Tatsache erklärt die begrenzten Möglichkeiten derartiger Methoden.
Das Ziel dieser Dissertation ist es, die Zugänglichkeit von Webseiten für blinde BenutzerIn-
nen zu verbessern. Um dieses Ziel zu erreichen, schlagen wir eine komplexe Lösung vor, die
alle Probleme des automatischen Verstehens der funktionalen Elemente einer Webseite auf den
dargestellten Webseiten und ihrer Navigation abdeckt. Zunächst stellen wir Mittel zur Analyse
und zum Verstehen einer Webseite auf der visuellen Ebene zur Verfügung, die die Hauptin-
formation transportieren, die nicht nur durch den Textinhalt, sondern auch durch Layout, Stile
und andere Eigenschaften, die von sehenden BenutzerInnen wahrgenommen werden können,
vermittelt wird. Zweitens werden die Probleme bei der Verbesserung der Internetmobilität von
blinden BenutzerInnen auf der Basis der erkannten logischen Elemente einer Webseite im Detail
untersucht und Lösungen vorgeschlagen.

Keywords:
Web


Related Projects:
Project Head Reinhard Pichler:
Heterogene Information Integration


Created from the Publication Database of the Vienna University of Technology.