|
- Die Sortierreihenfolge von Ergebnislisten der Google-artigen Volltext-Suche der Publikationsdatenbank (in der "globalen Suchfunktion" sowie den öffentlich zugänglichen oder im Administrationsprogramm implementierten Publikations- und Exportlisten-Funktionen) wurde aussagekräftiger gestaltet: Der vom Datenbank-Backend auf Basis diverser formaler Kriterien, aber ohne Berücksichtigung der Semantik ermittelte Relevanz-Wert, nach dem die Publikationslisten in diesem Suchmodus sortiert sind, kann nunmehr mit Korrekturfaktoren gewichtet werden, die für jede Publikations- und Medientype individuell eingestellt werden können. Sofern in einer Implementierung die Publikationseintrags-Attribute "mit Peer Review" und/oder "SCI- (SSCI-, A&HCI-) Publikation" individuell gesetzt werden können, können auch für diese Attribute - individuell für jede Publikationstype - Korrekturfaktoren definiert werden. Diese zusätzliche Gewichtung betrifft ausschließlich die Reihenfolge der Einträge; bei den auf 200 Einträge begrenzten öffentlichen Ausgabelisten kann sie allerdings entscheidend dafür sein, ob ein bestimmter Eintrag noch unter die ersten 200 kommt oder nicht. Defaultmäßig sind alle diese Korrekturfaktoren gleich 1, und die zusätzliche Gewichtung ist deaktiviert. Bei aktivierter Gewichtung werden die vom Datenbank-Backend ermittelten Relevanz-Werte jeweils mit dem Produkt aller für den betreffenden Publikationseintrag zutreffenden Korrekturfaktoren multipliziert. Damit können als höherwertig erachtete Publikationen (beispielsweise begutachtete und SCI- (SSCI-, A&HCI-) Publikationen) relativ zu den übrigen Publikationen in ihrer Relevanz angehoben werden. Andererseits kann die Relevanz von ihrem Wesen her weniger relevanter Publikationen abgesenkt werden. Dies kann sich insbesondere im so genannten "Boole'schen Modus" der Volltextsuche, bei dem die Suchbegriffe mit zusätzlichen Operatoren versehen werden, vorteilhaft auswirken. Normalerweise haben alle Datensätze, die im "Boole'schen Modus" der Volltextsuche gefunden wurden, die gleiche Relevanz (typisch 100), und die Ausgabeliste ist de facto primär nach Publikationstypen sortiert. Durch eine höhere Gewichtung wichtiger Publikationen können diese in der Ausgabeliste nach vorne gereiht werden.
Die Gewichte können im Grunde beliebige Gleitkomma-Zahlen sein. Sie können in den nur für Administrator/innen zugänglichen Funktionen "Publikationstypen-Bezeichnungen und -Sichtbarkeit editieren" und "Medientypen-Bezeichnungen und -Sichtbarkeit editieren" individuell eingestellt werden. Es empfiehlt sich aber, Werte in der Nähe von 1 zu verwenden, um eine einigermaßen den Erwartungen entsprechende Sortierung zu gewährleisten. Insgesamt, also unter Berücksichtigung der bis zu drei zusammenwirkenden Korrektur-Faktoren (für Publikationstype, Medientype und evtl. individuell gesetztes Attribut), sollte die Korrektur deutlich unter einem Faktor von 2, besser unter 1,5, liegen, um nicht zwar hochwertige, aber für die eingegebenen Suchbegriffe weniger relevante Publikationen zu weit nach vorne zu befördern.
- Bisher wurden Suchbegriffe, die über das Such-Textfeld auf der Startseite der Publikationsdatenbank eingegeben wurden, als potenzielle Inhalte von Publikationseinträgen interpretiert, und die Suche wurde immer im Google-artigen Modus vorgenommen. Dies war bei der Eingabe von Namen meist kontraproduktiv, weil die nach Relevanz sortierte Ausgabeliste nur in Ausnahmefällen einer erwarteten Reihenfolge entsprach. Zwar konnte mit der Funktion "Suche anpassen" bzw. durch Setzen einer Checkbox im Kopf der Ergebnisliste der Suchtext als Name interpretiert werden, was aber zumindest einen zusätzlichen Aufwand für die User bedeutete. (Bei der Suche nach Namen in der "globalen Suchfunktion" ist die Ausgabeliste nach Publikationsarten gegliedert und innerhalb einer Publikationsart nach Autor/innen, Titeln und Publikationsjahren sortiert. Bei der Google-artigen Volltext-Suche ist die Ausgabeliste primär nach abnehmender Relevanz und innerhalb gleicher Relevanz-Werte nach Publikationsarten, Autor/innen, Titeln und Publikationsjahren sortiert.)
Nunmehr wurde ein zusätzlicher Betriebsmodus für die "globale Suche" implementiert, der auf der Such-Auswahlseite (Seite "Suche in der Publikationsdatenbank ...") als Standard-Option voreingestellt ist und auch für Such-Anfragen von der Startseite der Publikationsdatenbank verwendet wird. Dabei wird zunächst geprüft, ob einer der eingegebenen Suchbegriffe der Name einer Person sein könnte. Je nach Suchtext können fünf verschiedene Szenarien auftreten:
- Der Suchtext enthält ausschließlich den Familiennamen oder den Familiennamen und den (vollen oder abgekürzten) Vornamen einer in der Publikationsdatenbank registrierten Person, wobei die Angabe von Familiennamen und Vornamen in beliebiger Reihenfolge erfolgen kann: In diesem Fall wird die Suche im "klassischen" Namens-Suchmodus vorgenommen, mit einer nach Publikationsarten gegliederten Ausgabeliste.
- Der Suchtext enthält keinen in der Publikationsdatenbank registrierten Namen: In diesem Fall wird im "klassischen" Google-artigen Publikations-Suchmodus gesucht; die Ergebnisliste ist nach abnehmender Relevanz der gefundenen Datensätze sortiert.
- Der Suchtext enthält sowohl den Namen einer Person (als Familien- oder Vor- und Familienname in beliebiger Form und Reihenfolge wie oben, wobei aber Familien- und Vorname unmittelbar nebeneinander stehen müssen) als auch Suchbegriffe, die keinen in der Publikationsdatenbank registrierten Namen entsprechen: In diesem Fall wird in einem Misch-Modus auf jene Publikationen eingeschränkt, in denen die spezifizierte Person als Autor/in oder sonstwie beteiligte Person aufscheint, und unter dieser Auswahl im Google-artigen Modus gesucht; die Ergebnisliste ist nach der Relevanz der gefundenen Datensätze sortiert.
- Der Suchtext enthält sowohl die Namen mehrerer Personen (wobei nur der erste Name als Familien- und Vorname spezifiziert werden sollte, um unerwartete Ergebnisse zu vermeiden) als auch Suchbegriffe, die keinen in der Publikationsdatenbank registrierten Namen entsprechen: In diesem Fall wird in einem Misch-Modus auf jene Publikationen eingeschränkt, in denen die spezifizierten Personen als Autor/in(nen) oder sonstwie beteiligte Personen aufscheinen, und unter dieser Auswahl im Google-artigen Modus gesucht; die Ergebnisliste ist nach der Relevanz der gefundenen Datensätze sortiert.
- Der Suchtext enthält ausschließlich die Namen mehrerer Personen (wobei nur der erste Name als Familien- und Vorname spezifiziert werden sollte, um unerwartete Ergebnisse zu vermeiden): In diesem Fall werden im "strikten" Publikations-Suchmodus die Autor/innen- und Herausgeber/innen-Listen der Publikationen nach den angegebenen Nachnamen durchsucht, und eine nach Publikationsarten gegliederte Ausgabeliste jener Publikationen, in denen alle genannten Personen aufscheinen, erstellt. Im Gegensatz zu den übrigen vier Such-Moden ist dieser Modus aufgrund der internen Struktur des Datenbank-Backends deutlich langsamer.
In den mittleren drei Suchmoden kann durch Setzen der Checkbox "Strikte Suche" statt im Google-artigen Modus im "strikten" Modus gesucht werden; in diesen Fällen sind die Suchoperationen deutlich zeitaufwändiger (und die Suchergebnisse deutlich treffender); die Ausgabeliste ist dann nach Publikationsarten gegliedert. Im ersten und fünften Suchmodus wird die Checkbox "Strikte Suche" zurückgesetzt bzw. ihr Status (als irrelevant, weil ohnedies im "strikten" Modus gesucht wird) ignoriert.
- Die Funktion "Publikations- und Exportlisten erstellen" des Administrationsprogramms wurde nun so erweitert, dass auch dort nach Relevanz sortierte Suchergebnis-Publikationslisten ausgegeben werden können. (Dieses Feature war bisher mangels dringenden Bedarfs noch nicht voll implementiert.)
|