[Back]


Diploma and Master Theses (authored and supervised):

M. Frühwirth:
"Secure, Cost-Efficient and Redundant Data Placement in the Cloud";
Supervisor: S. Schulte, P. Waibel; Institute of Information Systems Engineering, Distributed Systems Group, 2019; final examination: 2020-01-20.



English abstract:
The use of cloud-based storage services to store data is nowadays a popular alternative to traditional local storage systems. In comparison to conventional storage solutions, cloud-based storages can increase data integrity, availability and durability while lowering the overall IT infrastructure cost. Therefore, more and more businesses, organizations and even private persons use cloud storage systems. Especially, for smaller and medium-sized enterprises, the use of cloud storage systems can be more favorable in comparison to maintain their own common storage solution. However, besides the already discussed benefits, cloud-based storage solutions brings also downsides with it. The huge amount of different cloud storage providers, storage techniques, geographical locations and pricing models makes the search for the best-fitting cloud storage provider a tricky task. One of the biggest problems of using cloud-based storage systems is the reliance on the cloud storage provider itself, especially if only one is used. Such a provider can suddenly increase the price of the storage service or can go out of business. This situation, where the data owners´ needs depend on a particular cloud storage provider is denoted as vendor lock-in. Furthermore, storing data off-site removes the physical control of the data owner and passes it to the cloud storage provider. Possible security breaches or other faulty actions of the cloud storage provider can lead to unwanted disclose of sensitive data. Therefore, the goal of this thesis is to provide a cloud-based middleware that uses several independent cloud storage providers to store data objects in a secure, authenticated, redundant and cost-efficient way. To find a cost-efficient placement solution, we formulate a global optimization approach that takes into account historical data access information and ensures predefined Quality-of-Service (QoS) requirements. To reduce the required cloud storage space and thus the overall cost, each data object will be minimized in terms of its size by using an efficient compression algorithm. To ensure high security and authenticity, we make use of an authenticated and secure encryption algorithm. To overcome the risk of vendor lock-in and to provide high data availability, we use erasure coding as redundancy mechanism. Finally, we extensively evaluate the designed optimization approach by simulating a real-world scenario over a period of six month and by proving the correct functionality through a detailed analysis of the results.

German abstract:
Die Verwendung cloud-basierter Dienste zur Datenspeicherung ist eine beliebte Alternative zu herkömmlichen Speichersystemen geworden. Die Nutzung solcher Speichersysteme kann die Datenintegrität, Datenverfügbarkeit und Datenbeständigkeit erhöhen und zugleich anfallende IT-Infrastrukturkosten senken. Immer mehr Unternehmen, Organisationen und auch Privatpersonen verwenden daher cloudbasierte Services zur Speicherung von Daten. Die Nutzung von cloudbasierten Speicherlösungen bringt aber auch einige Nachteile mit sich. Die große Vielzahl der Cloud-Anbieter, die unterschiedlichen Speichertechnologien und die teilweise komplexen Preismodelle erschweren die Suche nach einem geeigne- ten Service-Anbieter. Eines der größten Probleme bei der Verwendung cloudbasierter Speichersysteme ist die Abhängigkeit von einem bestimmten Anbieter, insbesondere wenn für die Datenspeicherung nur ein einziger Cloud-Anbieter verwendet wird. Dieser kann nämlich jederzeit den Preis des Speicherdienstes erhöhen oder seine Serviceleistung einstellen. Solch eine Situation, bei der die Bedürfnisse der Dateneigentümer von einem bestimmten Cloud-Speicheranbieter abhängen, wird auch als Vendor Lock-In bezeichnet. Weiters wird dem Dateneigentümer durch die entfernte Datenspeicherung die physische Kontrolle über seine Daten entzogen und an den Service-Anbieter übergeben. Mögliche Sicherheitsverletzungen oder andere fehlerhafte Handlungen des Cloud-Betreibers können zu einer unerwünschten Offenlegung sensibler Daten führen. Das Ziel dieser Arbeit ist es daher, eine Cloud-basierte Middleware zu implementieren, welche mehrere unabhängige Cloud-Speicheranbieter verwendet, um Datenobjekte si- cher, authentifiziert, redundant und kostengünstig zu speichern. Um eine kosteneffiziente und dynamische Platzierung der Datenobjekte zu ermöglichen, formulieren wir einen globalen Optimierungsansatz, welcher historische Daten des Datenzugriffs berücksich- tigt und vordefinierte Dienstgüteanforderungen gewährleistet. Um den erforderlichen Cloud-Speicherplatz und damit die Gesamtkosten zu reduzieren, wird ein effizienter Kompressionsalgorithmus verwendet. Darüber hinaus wird durch die Verwendung eines authentifizierten und sicheren Verschlüsselungsalgorithmus eine hohe Sicherheit und Authentizität sichergestellt. Um eine hohe Verfügbarkeit zu erzielen und einen Vendor Lock-In auszuschließen, wird Erasure Coding als Redundanzmechanismus verwendet. Abschließend evaluieren wir den entworfenen Optimierungsansatz, indem wir ein realis- ix tisches Szenario über einen Zeitraum von sechs Monaten simulieren und die korrekte Funktionalität durch eine detaillierte Analyse der Ergebnisse belegen.

Keywords:
Cloud Computing / Storage / Elastic Storage

Created from the Publication Database of the Vienna University of Technology.