|
Version 3.45 ist ein Musterbeispiel dafür, wie ein Feedback durch die Benutzer/innen der Publikationsdatenbank zu neuer und/oder verbesserter Funktionalität beitragen kann:
Auslöser war ein Hinweis von Frau Prof. Döring-Williams, dass Personen, die unter mehreren unterschiedlichen Namen in der Publikationsdatenbank existieren, in der globalen Suchfunktion der Datenbank ("Suche in der Publikationsdatenbank...") jeweils nur mit jenen Publikationen gefunden werden können, die unter dem für die Suche verwendeten Namen eingetragen wurden. Dieser Umstand - der in erster Linie Frauen betrifft, die nach ihrer Verehelichung unter einem neuen oder einem Doppelnamen publizieren - macht mehrfache Such-Operationen erforderlich oder verzerrt überhaupt den Eindruck von der Publikationstätigkeit der betroffenen Person.
Tatsächlich erfolgte bisher eine Namens-Suche in der globalen Suchfunktion in Form einer reinen Text-Suche; die in den Publikationslisten-Funktionen seit Jahren verwendete Alias-Funktionalität wurde in der globalen Suchfunktion bisher nicht benutzt.
Eine umfassende Überarbeitung des Such-Algorithmus der globalen Suchfunktion ermöglicht jetzt nicht nur die Berücksichtigung etwaiger Alias-Einträge, sondern bringt auch Verbesserungen in Usability und Performance der Suchfunktion:
- Im Default-Modus der globalen Suchfunktion ("Suchziel automatisch auswählen") und im Namens-Suchmodus ("Der Suchtext enthält Namen von Personen (Namens-Datensätze durchsuchen)") wird der eingegebene Suchtext zunächst an Leer- oder Trennzeichen (",", ";", "+") in Einzel-Wörter zerlegt (wobei Textteile in doppelten Anführungszeichen nicht auseinandergebrochen werden). Für jedes dieser Such-Wörter wird überprüft, ob es als Familienname in den Namens-Datensätzen der Publikationsdatenbank vorkommt. Ist dies der Fall, wird geprüft, ob das dem aktuellen Such-Wort unmittelbar vorangehende oder folgende Wort als (voller oder abgekürzter) Vorname der gefundenen Person(en) interpretiert werden kann (was allenfalls eine Einschränkung der Auswahl bei mehreren Personen mit gleichem Familien-, aber unterschiedlichen Vornamen bewirkt). Wird kein passender Vorname gefunden, wird nur der Familienname für die Suche herangezogen. Für jeden der auf diese Weise gefundenen Namens-Datensätze wird nach allfälligen Alias-Einträgen gesucht; die Suche nach Publikationen wird auf jene eingeschränkt, an der eine der durch die Namens- oder Alias-Datensätze identifizierten Personen als Autor/in oder Herausgeber/in usw. beteiligt war.
- In gleicher Weise können grundsätzlich im Suchtext die Namen beliebig vieler Personen aufscheinen; die Auswahl wird dann auf jene Publikationen eingeschränkt, an denen alle diese Personen (einschließlich ihrer Aliase) gemeinsam beteiligt waren.
- Aus Performance-Gründen musste die Anzahl der maximal im Suchtext berücksichtigten Namen auf fünf begrenzt werden. Seitens des Datenbank-Backends wäre zwar eine simultane Suche nach knapp 30 Namen möglich; bei einer großen Anzahl zu durchsuchender Datensätze kann jedoch die Suche nach einer zu großen Anzahl von Namen prohibitiv langsam verlaufen und sogar den Server komplett blockieren (insbesondere, wenn sie mehrfach abgebrochen und wiederholt wird). Jene Wörter des Suchtextes, die als Namen erkannt wurden, werden zwar immer bei einer allfällig nachfolgenden Suche in den Publikations-Datensätzen ausgeblendet; es wird jedoch aktiv nur nach den ersten fünf Namen im Suchtext gesucht (was in den meisten Fällen wohl ausreichend sein wird). Falls dieser Fall eintritt, wird mit einer Meldung darauf hingewiesen.
- Ein Wort des Suchtextes, das beim oben beschriebenen Ablauf als Familien- oder Vorname identifiziert wurde, wird als "verwendet" markiert. Bleiben danach noch unverwendete Wörter des Suchtextes übrig, werden diese als Suchbegriffe interpretiert, nach denen in Publikations-Datensätzen gesucht wird. Für diese Suche wird, je nachdem, ob die Option "Strikte Suche" gesetzt ist oder nicht, der strikte oder der Google-artige Such-Algorithmus verwendet.
- Diese Vorgangsweise erlaubt die folgenden Such-Szenarien (wobei die Suche auf der Startseite der globalen Suche zusätzlich auf bestimmte Datenfelder der Publikations-Datensätze, bestimmte Publikationstypen, einen bestimmten Zeitraum und auf bestimmte Fakultäten eingeschränkt werden kann):
- Suche nach allen Publikationen einer einzelnen Person: Es wird nur der Familien- oder der Vor- und Familienname der gewünschten Person eingegeben. Ausgegeben wird eine nach Publikationstypen strukturierte Liste.
- Suche nach allen gemeinsamen Publikationen mehrerer Personen: Es werden mehrere Familien- oder Vor- und Familiennamen eingegeben. Ausgegeben wird eine nach Publikationstypen strukturierte Liste.
- Suche nach allen Publikationen einer einzelnen Person, die bestimmte Suchbegriffe enthalten: Es werden der Familien- oder der Vor- und Familienname der gewünschten Person sowie beliebig viele Suchbegriffe in beliebiger Reihenfolge eingegeben. Ausgegeben wird im Standard-Modus (Google-artige Suche) eine nach Relevanz gereihte Liste, bei strikter Suche eine nach Publikationstypen strukturierte Liste.
- Suche nach allen allen gemeinsamen Publikationen mehrerer Personen, die bestimmte Suchbegriffe enthalten: Es werden mehrere Familien- oder Vor- und Familiennamen sowie beliebig viele Suchbegriffe in beliebiger Reihenfolge eingegeben. Ausgegeben wird im Standard-Modus (Google-artige Suche) eine nach Relevanz gereihte Liste, bei strikter Suche eine nach Publikationstypen strukturierte Liste.
- Suche nach beliebigen Suchbegriffen: Es werden beliebig viele Suchbegriffe (die keinem in der Publikationsdatenbank gelisteten Familiennamen entsprechen) in beliebiger Reihenfolge eingegeben. Ausgegeben wird im Standard-Modus (Google-artige Suche) eine nach Relevanz gereihte Liste, bei strikter Suche eine nach Publikationstypen strukturierte Liste.
- Bedingt durch den verwendeten Suchalgorithmus gelten die folgenden Einschränkungen:
- Eine Einschränkung auf bestimmte Datenfelder der Publikations-Datensätze ist zwar immer möglich, aber nur dann relevant, wenn auch tatsächlich nach Inhalten von Publikations-Datensätzen gesucht wird (also nicht bei einer reinen Namens-Suche).
- Vornamen, die auch als Familiennamen interpretiert werden können, sollten immer dem Nachnamen nachgestellt oder in abgekürzter Form angegeben werden. Stehen sie im Suchtext vor dem Familiennamen der eigentlich gesuchten Person, werden sie ihrerseits als Familienname interpretiert. Da die solchermaßen irrtümlich identifizierten Personen nur in Ausnahmefällen gemeinsam mit der gesuchten Person publiziert haben werden, wird in diesem Fall die (leere) Menge der gemeinsamen Publikationen als Ergebnis zurückgegeben. (Das ist aber auch aus der Auflistung der verwendeten Suchbegriffe auf der Ergebnis-Seite zu ersehen.)
- Gegenüber dem bisher verwendeten Such-Algorithmus ergeben sich die folgenden Vorteile:
- In die Suche werden jetzt auch Alias-Einträge (mit gegebenenfalls ganz anderem Familiennamen) mit einbezogen.
- Es ist eine saubere Suche nach gemeinsamen Publikationen mehrerer durch Familien- und Vornamen identifizierter Personen möglich. (Bisher konnte nach gemeinsamen Publikationen mehrerer Personen nur unter Verwendung ihrer Familiennamen gesucht werden.)
- Die gleichen Such-Algorithmen können für eine beliebige Anzahl von Personen verwendet werden. (Bisher wurden unterschiedliche Algorithmen für die Suche nach einer bzw. nach mehreren Personen verwendet.)
- Die Such-Algorithmen sind trotz erhöhter Leistungsfähigkeit effizienter geworden.
Bei dieser Gelegenheit wurde auch ein Bug behoben, der bewirkt hatte, dass bei einem Such-Aufruf von der englischen Version der Startseite die deutschsprachige Version der Ausgabeliste angezeigt wurde.
|