[Back]


Doctor's Theses (authored and supervised):

N. Mujezinovic:
"Improved Protein Identification After Fast Elimination of Non-Interpretable Peptide MS/MS Spectra and Noise Reduction";
Supervisor, Reviewer: G. Raidl, F. Eisenhaber; Institut für Computergraphik und Algorithmen, TU Wien, 2007; oral examination: 2007-05.



English abstract:
Tandem mass spectrometry (MS/MS) has become a standard method for protein
identification in biological samples, but in large-scale proteomics studies,
the huge number and the noise contamination of MS/MS spectra obstruct
swift and reliable computer-aided interpretation. Typically, less than 1% of
the spectra per sample and about 10% of the peaks per spectrum contribute
to the final result. The background peaks in the spectra result not only from
isotope variants and multiply charged replicates of the peptide fragmentation
products but also from unknown fragmentation pathways, sample-specific
or systematic chemical contaminations or from noise generated by the electronic
detection system. Besides dramatically prolonged computation time,
the noise can lead to incorrect protein identification, especially in the case of
de novo sequencing algorithms.
Two fast screens can essentially reduce the haystack of MS/MS data:
(1) Sequence ladder rules remove spectra non-interpretable in peptide sequences.
(2) Modified Fourier-transform-based criteria clear background in
the remaining data. On average, only a rest of 35% of the MS/MS spectra
(each reduced in size by about one quarter) have to be handed over to the
interpretation software with proportional decrease of computer resource consumption,
essentially without loss of information and a trend to improved
sequence coverage.
In this work, an algorithm for detection and transformation of multiply
charged peaks into singly charged monoisotopic peaks, removal of heavy
isotope replicates and random noise is described. The approach is based on
numerical spectral analysis and signal detection methods. The algorithm has
been implemented in a stand-alone computer program called MS Cleaner.

German abstract:
Tandem-Massenspektrometrie (MS/MS) ist die Standardmethode fšur die Proteinidentifikation
in biologischen Pršaparaten. In Proteomics-Studien behindert
aber die große Zahl der zu bearbeitenden MS/MS-Spektren und deren
Kontaminierung mit Hintergrund-Peaks die schnelle und zuverlšassige computergest
šutzte Interpretation. Typischerweise tragen weniger als 1% der
Spektren pro Pršaparat und nur etwa 10% der Peaks pro Spektrum zum Endresultat
bei. Die Hintergrund-Peaks in den Spektren stammen nicht nur
von den Isotopenvarianten und mehrfach geladenen Replikaten der Peptid-
Fragmentationsprodukte, sondern auch von unbekannten Fragmentationswegen,
pršaparatspezifischen oder systematischen chemischen Kontaminationen
oder vom Rauschen der empfindlichen elektronischen Nachweissysteme. Neben
der dramatischen Verlšangerung der Rechenzeit der Interpretationssoftware
kann der Hintergrund auch zur falschen Proteinidentifikation fšuhren,
insbesondere bei de novo- Sequenzierungsalgorithmen.
In dieser Arbeit wurden unter anderem zwei schnelle Verfahren entwickelt,
die den "Heuhaufen" der MS/MS-Daten wesentlich reduzieren: (1) Sequenzleiterregeln
sortieren Spektren aus, von denen sich keine Peptidsequenzen
ableiten lassen. (2) Techniken auf Basis Modifizierter Fourier-Transformation
lšoschen einen Teil des Hintergrunds in den verbleibenden Spektren. Im
Durchschnitt mšussen nur ca. 35% der urspršunglichen MS/MS-Spektren, die
wiederum um ca. ein Viertel in ihrer Gršoße reduziert wurden, an die Interpretationssoftware
šubergeben werden. Dies wird faktisch ohne Verlust an
Information und mit einer erhšohten Sequenzabdeckung erreicht, obwohl die
benšotigte Rechenzeit um etwa zwei Drittel reduziert wurde. Der Algorithmus
wurde in Form der Anwendung MS Cleaner implementiert.

Created from the Publication Database of the Vienna University of Technology.