Volltext-Suche in der Publikationsdatenbank

Die Publikationsdatenbank bietet zwei komplementäre Such-Algorithmen für eine Volltext-Suche an:

Die standardmäßig verwendete Google-artige Suchfunktion ist schneller und liefert nach Relevanz gereihte Ergebnislisten; insbesondere bei Verwendung kurzer Such-Begriffe sind die Ergebnisse aber oft etwas unerwartet. Es werden (zumindest im Standard-Suchmodus) jene Publikationseinträge ausgewählt, die mindestens eines der Wörter des Suchtextes enthalten. Eine größere Anzahl von Suchbegriffen vergrößert daher in der Regel die Anzahl der Ergebnisse. Weitere Informationen zur Optimierung der Anwendung der Google-artigen Suchfunktion finden Sie in der nachstehenden Beschreibung.

Die strikte Text-Suchfunktion wird durch Setzen der Checkbox "Strikte Suche" im Feld "Suche nach" aktiviert. Sie ist - insbesondere bei fehlender oder sehr weit gefasster sonstiger Einschränkung der Publikationsauswahl - deutlich langsamer als die Google-artige Suchfunktion; sie liefert als Ergebnis eine nach Publikationsarten gruppierte Liste jener Datensätze, die alle angegebenen Suchbegriffe enthalten. Eine größere Anzahl von Suchbegriffen verringert daher die Anzahl der Ergebnisse. Weitere Informationen zur strikten Text-Suchfunktion finden Sie in der untenstehenden Beschreibung dieses Such-Algorithmus.

Bei der Google-artigen Suchfunktion werden nur Wörter in den Publikations-Datensätzen gefunden, die genau gleich einem der angegebenen Suchbegriffe sind (oder - bei Verwendung des optionalen Operators "*" - mit einem der Suchbegriffe beginnen). Die strikte Text-Suchfunktion findet hingegen auch Datensätze, bei denen einer der Suchbegriffe als Teil eines Worts vorkommt. Daher findet die Google-artige Suchfunktion bei Angabe des Suchbegriffs "elektron" nur Datensätze, in denen das Wort "Elektron" (in beliebiger Groß- oder Kleinschreibung) existiert; die strikte Text-Suchfunktion findet hingegen auch "Mikroelektronik". (Bei Eingabe von "elektron*" würde die Google-artige Suchfunktion zwar "Elektronik", nicht aber "Mikrolektronik" finden. Ein vorangestellter "*" ("*elektron" oder "*elektron*") wird von der Google-artigen Suchfunktion ignoriert.)

Bei beiden Such-Algorithmen werden die durch die übrigen Auswahlkriterien bestimmten Publikationsdatensätze durchsucht, wobei entweder jeweils der gesamte Datensatz oder nur Teile davon durchsucht werden können. Wenn das Feld "Suchen nach" leer ist, erfolgt keine Textsuche; in diesem Fall werden alle den übrigen Kriterien entsprechenden Einträge ausgegeben. Die Groß- oder Kleinschreibung des Suchbegriffs wird in jedem Fall ignoriert.


Die Google-artige Volltext-Suchfunktion

Die Google-artige Volltext-Suchfunktion verwendet eine Funktionalität des Datenbank-Backends; sie ist daher im Programmcode der Publikationsdatenbank nur bedingt konfigurierbar. Da sie wesentlich schneller und mit höherer Wahrscheinlichkeit als die strikte Text-Suchfunktion Ergebnisse liefert, wurde sie als Standard-Suchfunktion implementiert.

Bei Verwendung dieser Suchfunktion wird eine nach der Relevanz der gefundenen Daten sortierte Liste ausgegeben. Der Relevanz-Wert wird zur Information ebenso ausgegeben wie die Publikationsart der jeweiligen Publikation. Die Relevanz eines Eintrags nimmt mit der Häufigkeit der Nennung eines der Wörter des Suchtextes zu. Weites können auch die Publikationsart und die Qualität der Publikation in die Ermittlung des Relevanz-Wertes eingehen.

Die folgenden Regeln gelten grundsätzlich für die Google-artige Volltext-Suche:

  • Wörter im Suchtext mit weniger als vier Buchstaben werden ignoriert.
  • Sehr häufig (in der englischen Sprache) vorkommende Wörter werden ignoriert.
  • Suchbegriffe, die in mehr als der Hälfte der Datensätze vorkommen, werden ignoriert.
  • Häufig vorkommende Wörter haben ein geringeres Gewicht als selten vorkommende (und tragen daher weniger zur Relevanz des Datensatzes bei).
  • Im Standard-Modus der Google-artigen Suche werden Datensätze als Ergebnis zurückgegeben, die mindestens eines der in einem aus mehreren Wörtern bestehenden Suchbegriff enthaltenen Wörter enthalten. Längere Suchbegriffe liefern daher in der Regel mehr Ergebnis-Datensätze; die Relevanz jener Datensätze, die alle Wörter des Suchbegriffs enthalten, ist jedoch deutlich größer.

Die Suche kann durch eine Reihe von Operatoren angepasst werden. Bei Verwendung von mindestens einem dieser Operatoren ändert sich die Gewichtung der Datensätze; es werden auch Wörter, die in mehr als der Hälfte der Datensätze vorkommen, nicht mehr ignoriert. Die folgenden Operatoren stehen zur Verfügung:

  • "+": Ein einem Such-Wort unmittelbar vorangestelltes "+" erzwingt, dass dieses Wort in jedem gefundenen Datensatz vorkommen muss.
  • "-": Ein einem Such-Wort unmittelbar vorangestelltes "-" erzwingt, dass dieses Wort in keinem gefundenen Datensatz vorkommen darf.
  • ">": Ein einem Such-Wort unmittelbar vorangestelltes ">" erhöht die Relevanz dieses Suchbegriffs.
  • "<": Ein einem Such-Wort unmittelbar vorangestelltes "<" verringert die Relevanz dieses Suchbegriffs.
  • "( )": In Klammern stehende Ausdrücke werden als Sub-Ausdrücke interpretiert.
  • "~": Eine einem Such-Wort vorangestellte "~" verringert die Relevanz dieses Such-Worts, ohne es aber vollständig auszublenden.
  • "*": Ein an ein Such-Wort angehängter "*" steht für alle Wörter, die mit dem Such-Wort beginnen.
  • "" "": Ein Suchbegriff in doppelten Anführungszeichen ("" "") wählt nur jene Datensätze aus, in denen der Suchbegriff wörtlich, so wie eingegeben, vorkommt.

Insbesondere bei Kombination mehrerer dieser Operatoren können die Ergebnisse aber auch von den hier beschriebenen abweichen; da es sich bei der Google-artigen Volltext-Suchfunktion um eine Funktion des Datenbank-Backends handelt, liegt sie nicht im Einflussbereich des Datenbank-Entwicklers!

Die folgenden Beispiele - der Dokumentation des Datenbank-Backends entnommen - sollen die Anwendung der oben beschriebenen Operatoren illustrieren:

  • "Apfel Banane": Liefert Datensätze, die mindestens eines dieser Worte enthalten.
  • "+Apfel +Saft": Liefert Datensätze, die beide Worte enthalten.
  • "+Apfel Kronprinz": Liefert Datensätze, die das Wort "Apfel" enthalten, wobei Datensätze, die auch "Kronprinz" enthalten, ein höheres Gewicht haben.
  • "+Apfel -Kronprinz": Liefert Datensätze, die das Wort "Apfel", nicht aber das Wort "Kronprinz" enthalten.
  • "+Apfel +(>Kuchen <Strudel)": Liefert Datensätze, die das Wort "Apfel" und eines der Worte "Kuchen" oder "Strudel" (in beliebiger Reihenfolge) enthalten, wobei aber "Kuchen" ein höheres Gewicht hat als "Strudel".
  • "Apfel*": Liefert Datensätze, die das Wort "Apfel" oder beliebige Worte, die mit "Apfel" beginnen, enthalten, beispielsweise "Apfelsaft".
  • ""ein Beispiel"": Liefert nur Datensätze, die exakt die Phrase "ein Beispiel" enthalten.

Die strikte Text-Suchfunktion

Dieser Such-Modus wird durch Setzen der Checkbox "Strikte Suche" im Feld "Suche nach" aktiviert.

Wenn ein aus mehreren Wörtern bestehender Suchbegriff eingegeben wird, so wird standardmäßig nach Datensätzen gesucht, die alle Wörter des Suchbegriffs enthalten, wobei diese an beliebigen Stellen des Publikationsdatensatzes, gleichgültig in welcher Reihenfolge und in welchen der zu durchsuchenden Felder, stehen können. Die folgenden Zeichen gelten als Trennzeichen zwischen Wörtern:

  • Leerschritt
  • , (Komma)
  • ; (Semikolon)
  • + (Plus)
Alle anderen Zeichen, insbesondere auch Klammern um den Suchbegriff, werden als Teil des zu suchenden Textes interpretiert!

Der Suchtext "Das ist ein Beispiel" bewirkt also eine Suche nach Datensätzen, die die vier Worte "Das", "ist", "ein" und "Beispiel" in beliebiger Reihenfolge an beliebigen Stellen der mit der Klappliste "Text suchen in:" spezifizierten Teile der Publikationsdatensätze enthalten.

Suchbegriffe, die aus einem der oben genannten Trennzeichen bestehen oder dieses enthalten, die aber nicht durch das Trennzeichen getrennt werden sollen, können zwischen doppelte Anführungszeichen (") gesetzt werden. Paare von Anführungszeichen werden vor der eigentlichen Suche entfernt; sie verhindern aber die Aufspaltung des zwischen ihnen stehenden Textes. Der Suchtext kann beliebig viele Suchbegriffe in Paaren von Anführungszeichen enthalten. Der Suchtext ""Das ist" "ein Beispiel"" wird daher in die Wortpaare "Das ist" und "ein Beispiel" umgesetzt, nach denen die Publikationsdatensätze durchsucht werden. Um nach einem der obigen Trennzeichen zu suchen, muss dieses ebenfalls zwischen doppelte Anführungszeichen gesetzt werden (z.B. ""+"" für die Suche nach einem Plus-Zeichen). Suchbegriffe, die ihrerseits ein doppeltes Anführungszeichen enthalten, sind zulässig; sie müssen aber hinter allen in Paare von Anführungszeichen gesetzten Suchbegriffen stehen.

Sie könnten auch den gesamten Suchtext in doppelte Anführungszeichen setzen, also ""Das ist ein Beispiel"" , oder die Checkbox "Exakt nach diesem Text suchen" aktivieren. Die Einstellung dieser Checkbox ist nur dann relevant, wenn die Checkbox "Strikte Suche" gesetzt wurde. Verwenden Sie dieses Feature, wenn Sie sicher sind, dass es Datensätze mit exakt ihrem Suchtext gibt, und wenn Sie mit der Standardeinstellung zu viele Such-Treffer erhalten.

Beachten Sie bitte auch:

  • Der zu suchende Text muss (unter Berücksichtigung des Nachstehenden) wörtlich in einem Publikationsdatensatz enthalten sein, um gefunden werden zu können. Eine Suche nach ähnlichen Wörtern ist mit der strikten Suche nicht möglich!
  • Die Suche ist unabhängig von Groß- oder Kleinschreibung. Mit dem Suchtext "electron" finden Sie Datensätze, die "electron", "Electron", "ELECTRON" oder dieses Wort in jeder anderen Kombination von Groß- und Kleinbuchstaben enthalten.
  • Datensätze werden auch dann gefunden, wenn die von Ihnen eingegebenen Suchbegriffe nur als Teile eines Wortes aufscheinen. Mit dem Suchtext "electron" erhalten Sie beispielsweise auch Datensätze mit den Wörtern "electronic" oder "nanoelectronic", nicht aber "electromagnetic".
  • Die Zeichen "%" und "_" können im Feld "Suchen nach" als Platzhalter für eine beliebige Anzahl von Zeichen bzw. für genau ein Zeichen verwendet werden. Bei Eingabe von "ele_tron" oder "ele%tron" bekommen Sie sowohl Datensätze mit der deutschen ("Elektron") als auch mit der englischen Version ("electron") dieses Wortes sowie alle Datensätze, die eine der beiden Versionen als Teil eines Wortes enthalten. Mit "electr%ic" finden Sie sowohl "electric" als auch "electronic" oder "electromagnetic". (Für eine Suche nach "%" ist die Zeichenfolge "\%" einzugeben, für eine Suche nach "_" die Zeichenfolge "\_". Nach "\" kann nicht gesucht werden.)
  • Sie können doppelte Anführungszeichen um einen Suchbegriff verwenden, um nach Datensätzen zu suchen, die mehrere Wörter des Suchbegriffs unmittelbar hintereinander enthalten. Die Suchfunktion teilt Ihre Sucheingabe bei den oben aufgelisteten Trennzeichen (also auch bei Leerzeichen) in separate Wörter auf; wenn Sie also "hot electron" eingeben, wird nach Datensätzen gesucht, die diese beiden Wörter irgendwo in den zu durchsuchenden Teilen des Datensatzes enthalten. Um den Begriff "hot electron" präzise zu finden, geben Sie daher bitte ""hot electron"" als Suchbegriff an.
  • Bei der reinen Suche in Publikations-Datensätzen (Option "Publikations-Datensätze durchsuchen" in der Auswahlseite) kann nur nach jenen Informationen gesucht werden, die in einem "erweiterten Publikationsdatensatz" (also der Referenz und allfälligen Abstracts) enthalten sind. Verwenden Sie daher bitte für die Suche nach Autoren nur deren Familiennamen, allenfalls den Familiennamen und den abgekürzten Vornamen. Die vollen Vornamen von Autoren sind nicht in den Publikationsdatensätzen enthalten! Publikationen von Max Mustermann werden Sie daher mit "Mustermann", "M. Mustermann" oder "Mustermann M." finden können, nicht aber mit "Max Mustermann" oder "Mustermann Max".
  • Beachten Sie bitte, dass nur ein Teil der Publikationsdatensätze Abstracts oder Schlagworte enthält. Die Option "Text suchen in:" - "Abstracts" wird daher nicht immer die umfassendsten Ergebnisse liefern!
  • Suchen Sie bitte immer zuerst nach möglichst allgemein gehaltenen Begriffen, und engen Sie diese nur bei Bedarf ein. Bedenken Sie bitte, dass Sie mit jedem zusätzlichen Wort im Suchtext Ihre Suche noch weiter einengen!