[Back]


Diploma and Master Theses (authored and supervised):

S. Reichl:
"Ein Workflow für die Einzelzell-RNA-Sequenzierungsanalyse mit dem Ziel eines robusten und nachvollziehbaren Clusterings nach Zellpopulationen";
Supervisor: K. Grill; Institut für Stochastik und Wirtschaftsmathematik, E105.7 Mathematische Stochastik, 2018.



German abstract:
Die Sequenzierungsmethoden der zweiten Generation (engl. next generation sequencing), die Teile der DNA entschlpsseln, durchliefen in den letzten Jahren rapide Entwicklungen. Eine der neuesten Entwicklungen ermöglicht es Wissenschaftlern, die Genexpression von einzelnen Zellen zu quantifizieren. Eine dieser Technologien,
"micro-droplet sequencing", schaffte es, dieEinzelzell-RNA (Tran- skriptom) -Sequenzierung (engl. single cell RNA sequencing) an die Spitze dieses Forschungsgebietes zu katapultieren, da sie einen hohen Durchsatz und präzise Sequenzierungsinformationen für einen Bruchteil der Kosten ermöglicht.
Diese neue Technologie ermöglicht es Forschern eine neue Ära der Einzelzell-Sequenzierung und damit die Erforschung von biologischen Mechanismen auf zellulärer Ebene voran zu treiben. Verschiedene Anwendungen sind die Entdeckung neuer Zelltypen, die Identifikation von Angriffspunkten für die Medikamentenentwicklung oder die
Beobachtung biologischer Mechanismen auf zellulärer Ebene, um nur einige wenige zu nennen.
Durch die Anwendung dieser neuartigen Technologie wird eine noch nie dagewesene Art von Daten generiert. Daraus resultieren neue Herausforderungen auf dem Gebiet der Bioinformatik, zum Beispiel eine sehr hohe Dimensionalität der Daten, Anfälligkeit für Störfaktoren, Einschränkungen bei Visualisierungen, hohe Rauschanteile
und unzulängliche Ergebnisse in der Clusteranalyse. Die Literatur empfiehlt, diese Herausforderungen mit Verfahren wie Qualitätskontrolle, Normalisierung, Störfaktoranalyse, Dimensionsreduktion und Clusteranalyse zu bewältigen. Jedoch, besteht
die größte Herausforderung darin, die richtigen Methoden zu finden und einen Workflow für die rigorose Analyse solcher Daten zu entwickeln.
Diese Arbeit konzentriert sich auf die Entwicklung, Verifizierung und Validierung eines solchen Workflows, der alle neu entstandenen Herausforderungen adressiert.
Der Workflow basiert auf theoretischen Überlegungen unserer vorherigen Arbeit [Rei18] in diesem Bereich. Hauptziel ist eine robuste und nachvollziehbare Clusterfindung anhand von Zellpopulationen durch den Einsatz von hauptsächlich
automatisierter Methoden. Darüber hinaus wird die Entdeckung potenzieller Subpopulationen innerhalb von identifizierten Clustern oder nachfoglende Analysen durch die in den Ergebnissen des Workflows bereitgestellten Informationen gefördert.
Der Workflow wird mit Hilfe von simulierten Datensätzen verifiziert, die speziell so gestaltet wurden, dass sie Einzelzell-RNA-Sequenzierungsdaten entsprechen. Jeder Datensatz wurde parametrisiert, um bestimmte unterstützte Funktionen des Work-
flows und seine Grenzen hinsichtlich künstlich hinzugefügter Herausforderungen in der Form von Rauschen oder Störfaktoren zu testen.
Am Ende validieren wir den Workflow durch die Analyse eines realen öffentlich verfügbaren Datensatzes aus der Literatur und durch den Vergleich der Ergebnisse und biologischen Interpretation mit bereits vorhandenen Ergebnissen.

Keywords:
Single Cell RNA Analyse

Created from the Publication Database of the Vienna University of Technology.