[Zurück]


Zeitschriftenartikel:

A. Taha:
"Herausforderungen in der Anwendbarkeit von Metriken: Bias, Effizienz und Hubness";
GI-Edition Lecture Notes in Informatics, D-16 (2016), S. 289 - 298.



Kurzfassung deutsch:
Metriken spiegeln die Ähnlichkeiten bzw. Unterschied zwischen Objekten in Merkmalräumen wider. Es gibt in dieser Hinsicht drei Hauptprobleme: Erstens existieren hunderte von Metriken, die verschiedene Aspekte der Ähnlichkeit berücksichtigen, was den Bedarf an einer formalen Auswahlmethodik für Metriken motiviert. Für dieses Problem präsentieren wir eine detaillierte Analyse von 20 Metriken und präsentieren eine neue formale Methode für Metrikauswahl vor. Zweitens gibt es rechenintensive Metriken, deren ineffiziente Laufzeit in Verbindung mit großen Objekten ein Problem darstellt.Wir schlagen einen neuen beinahe zeit-linearen Algorithmus zur Berechnung der exakten Hausdorff-Distanz zwischen beliebigen Punktwolken vor. Drittens taucht in hoch-dimensionalen Featurespaces eine Kategorie von Schwierigkeiten auf, die als curse of dimensionality bekannt ist. Eine dieser Schwierigkeiten ist Hubness.Wir präsentieren eine neue Erklärung für die Ursache von Hubness, die auf einem neuen Modell der Distanzstruktur in hoch dimensionalen Datenräumen beruht. Auf Grundlage dieser Erklärung leiten wir einen Schätzer für Hubness ab, bzw. schlagen wir Verfahren zur Verringerung von Hubness vor.

Erstellt aus der Publikationsdatenbank der Technischen Universität Wien.