[Back]


Doctor's Theses (authored and supervised):

M. Ries:
"Video Quality Estimation for Mobile Video Streaming";
Supervisor, Reviewer: M. Rupp, Y. Koucheryavy; Institut für Nachrichtentechnik und Hochfrequenztechnik, 2008; oral examination: 10-24-2008.



English abstract:
For the provisioning of video streaming services it is essential to provide a required level of customer satisfaction, given by the perceived video stream quality. It is therefore important to choose the compression parameters as well as the network settings so that they maximize the end-user quality. Due to video compression improvements of the newest video coding standard H.264/AVC, video streaming for low bit and frame rates is possible while preserving its perceptual quality. This is especially suitable for video applications in 3G wireless networks. Mobile video streaming is characterized by low resolutions and low bitrates. The commonly used resolutions are Quarter Common Intermediate Format (QCIF,176x144 pixels) for cell phones, Common Intermediate Format (CIF, 352x288 pixels) and Standard Interchange Format (SIF or QVGA, 320x240 pixels) for data-cards and palmtops (PDA). The mandatory codec for Universal Mobile Telecommunications System (UMTS) streaming applications is H.263 but the 3GPP release 6 already supports a baseline profile of the new H.264/AVC codec. The appropriate encoder settings for UMTS streaming services differ for various streaming content and streaming application settings (resolution, frame and bit rate). In the last years, several objective metrics for perceptual video quality estimation were proposed. The proposed metrics can be divided into two main groups: human vision model based video metrics and metrics based on empirical modeling. The complexity of these methods is quite high and they are mostly based on spatial features, although temporal features better reflect the perceptual quality especially for low-rate videos. Most of these metrics were designed for broadband broadcasting video services and do not consider mobile video streaming scenarios.
The goal of the presented research is to estimate video quality of mobile video streaming at the user-level (perceptual quality of service) for a large set of possible codec settings in 3G network and for a wide range of video content. Measures were derived that do not need the original (non-compressed) sequence for the estimation of quality, because such reference-free measures reduce complexity and at the same time broaden the possibilities of the quality prediction deployment. New reference-free approaches are presented for quality estimation based on motion characteristics. Moreover, this thesis provides a detailed comparison of recently proposed models for video quality estimation.

German abstract:
Die Einführung der dritten Mobilfunkgeneration ermöglichte durch die hohleren Datenübertragungsraten die Anwendung von Multimedia Diensten. Echtzeit-Dienste, wie zum Beispiel Videostreaming und Videotelephonie, stellen hierbei für Mobilfunksysteme eine besondere Herausforderung dar, wegen der hohen Empfindlichkeit von Videodiensten gegenüber visuellen Störungen. Der H.264/AVC Videostandard ist durch seine hohe Effizienz besonders geeignet für die Codierung dieser Dienste. Er bietet eine sehr gute Videoqualität für Übertragungen bei niedrigen Bildwiederhol- und Bitraten.
Mobile Videostreaming Anwendungen zeichnen sich durch ihre niedrigen Auflosungen und niedrige Bitraten aus. Gängige Auflosungen sind QCIF (176x144 Pixel) für Mobiltelefone, CIF (352x288 Pixel) und SIF (320x240 Pixel) für Datenkarten und Palmtops.
Der UMTS Standard schreibt als Minimum H.263 als verpflichtenden Codec fur alle Terminals vor. Viele Terminals für Release 6 unterstutzen auch das Basisprofil des neuen H.264 Codecs. Die entsprechenden Encodereinstellungen fur UMTS-Streamingdienste unterscheiden sich abhängig vom Inhalt und Anwendung (Auflosung, Bildrate, Bitrate). Die Schatzung der vom Benutzer erfahrenen Videoqualität basierte in den letzten Jahren auf mehreren objektiven Parametern. Diese Metriken lassen sich in zwei Lager unterteilen. Die einen Metriken haben empirische Modelle als Grundlage, die anderen basieren auf Modellen für die menschliche visuelle Wahrnehmung. Die Komplexität dieser Methoden ist besonders hoch und sie sind sehr abhängig von räumlichen Merkmalen. Es hat sich jedoch gezeigt, dass bei der Verwendung mobiler Terminals zeitliche Merkmale die vom Benutzer wahrgenommene Qualität wesentlich besser widerspiegeln. Die meisten dieser Metriken wurden vor dem Hintergrund von Breitband - Videodiensten entworfen und passen daher nicht zu den niedrigen Datenraten einer mobilen Anwendung. Ziel der vorgestellten Forschung war es einen guten Schätzer für die Videoqualität mobiler Dienste zu finden. Das Modell basiert auf der auf Benutzerebene wahrgenommenen Qualität und kann eine große Anzahl von heute gebräuchlichen Codeceinstellungen in einem 3G Netz abdecken. Weiters ist die vorgeschlagene Metrik referenzfrei, das heißt die Bewertung der Qualität kann ohne die Kenntnis der Originalsequenz erfolgen. Dadurch wird die Komplexität deutlich reduziert und gleichzeitig die möglichen Anwendungsgebiete, in denen diese Metrik zum Einsatz kommen kann, erweitert. Abschließend stellt diese Arbeit einen umfangreichen Vergleich des verfügbaren und neuen Modells für verschiedene Szenarien dar.


Electronic version of the publication:
http://publik.tuwien.ac.at/files/PubDat_170043.pdf


Created from the Publication Database of the Vienna University of Technology.