|
Version 3.00 der Publikationsdatenbank bringt eine wesentliche Neuerung: Die bisher auf eine Anzahl von Einzel-Datenbanken - 10 in der Implementierung an der TU Wien, 6 in der Implementierung bei den Austrian Research Centers - aufgeteilte Datenbank wird zu einer einzigen Datenbank zusammengefasst. In Version 3.00 wurde versucht, die operativen Vorteile einer weitgehenden Entkopplung der Einzel-Datenbanken, wie sie vor Version 3.00 gegeben war, beizubehalten, wo immer dies sinnvoll und wünschenswert war, und andererseits die Nachteile der alten Lösung bezüglich Datenhaltung und Wartung nachhaltig zu beheben. Die Umstrukturierung auf eine einzige Gesamt-Datenbank hat die folgenden Konsequenzen:
- Alle für die Identifizierung von Autor/innen usw. erforderlichen Datensätze stehen jetzt in einer einzigen Datenbank-Tabelle. Damit ist es jetzt möglich, Publikationseinträge zu erstellen, deren Autor/innen aus unterschiedlichen Fakultäten stammen. Die bisher übliche Vorgangsweise, solche Publikationen mehrfach, einmal pro Fakultät, mit den nicht der Fakultät angehörigen Personen jeweils als "Externe (keine Angehörigen der Fakultät)" einzutragen, erübrigt sich damit. Die Publikationsdatenbank bietet Funktionen an, auch bestehende Publikationseinträge durch Zusammenführen der unterschiedlichen "Reinkarnationen" Fakultäts-übergreifend publizierender Personen zu korrigieren. (Während zum Zeitpunkt der TU-weiten Einführung der Publikationsdatenbank dort Fakultäts-übergreifende Publikationen eine relativ seltene Ausnahme darstellten, ließ die zunehmende Vernetzung der Fakultäten der TU Wien in gemeinsamen Projekt-Aktivitäten die Zusammenführung der Datenbanken immer dringlicher erscheinen. Eine ähnliche Situation war auch bei den Austrian Research Centers gegeben.)
- Zugriffe auf den Gesamt-Publikationsdaten-Bestand sind nun vom Konzept her weitaus unproblematischer implementierbar und grundsätzlich über die schon bisher vorhandenen Webservices und Datenschnittstellen möglich.
- Vor Version 3.00 war für jede Fakultäts-Publikationsdatenbank eine separate Installation der über 1000 Dateien der Publikationsdatenbank-Applikation erforderlich, was für die Wartung der Software nicht ganz unproblematisch war. Dank der Zusammenführung der Einzel-Datenbanken reicht jetzt eine einzige Installation der Applikation.
- Während bisher für jede Fakultäts-Publikationsdatenbank eine separate Web-Adresse vorgesehen war, was unter Secure HTTP (HTTPS) massive Probleme mit den Sicherheits-Zertifikaten, speziell unter Internet Explorer 7, zur Folge hatte, ist jetzt ein Zugang zur Publikationsdatenbank über eine einzige Web-Adresse und damit auch ohne Probleme unter HTTPS möglich. (Aus Kompatibilitätsgründen werden die alten Einstiegs-Adressen zwar weiterhin unterstützt; das Administrationsprogramm, das sinnvoller Weise unter Secure HTTP verwendet werden sollte, läuft aber auch bei einem Einstieg über die alten Zugangsadressen ausschließlich unter der im Sicherheitszertifikat spezifizierten Adresse.)
- Die Zusammenführung der Datenbanken bringt allerdings auch mit sich, dass die Datenbank-Tabellen um Vieles umfangreicher sind als bisher (z.B. an der TU Wien etwa 65.000 Publikationsdatensätze statt bisher 12.500 an der publikationsstärksten Fakultät). Damit sind deutlich größere Server-Ressourcen als bisher für die Datenbank-Operationen erforderlich, was speziell bei einem Mangel an Arbeitsspeicher mit drastischen Verschlechterungen der Performance, beispielsweise bei Datenbank-weiten Such-Operationen, verbunden ist. Dieser Problematik wurde mit einem Paket von Maßnahmen so weit wie möglich begegnet:
- Rigorose Optimierung des SQL-Programmcodes für die Abfragen und des PHP-Codes der zugehörigen Seiten. Dies bedeutete in praktisch allen Fällen, in denen Datenbank-Abfragen potenziell den gesamten Datenbestand oder einen erheblichen Teil davon umfassen, eine komplette Neustrukturierung der Abfragen.
- Implementierung der "fulltext"-Such-Funktionalität des MySQL-Datenbank-Backends (als Standard-Such-Algorithmus in den öffentlich zugänglichen Seiten, wobei aber die bisher verwendeten Such-Algorithmen nach wie vor angeboten werden, weil sie in manchen Belangen der MySQL-"fulltext"-Funktionalität deutlich überlegen sind). Die "fulltext"-Suche ist zwar um etwa eine Größenordnung schneller als die bisher angewandten Algorithmen; sie ist aber auch mit gewissen Einschränkungen in der Funktionalität verbunden.
- Upgrade von der bisher (an der TU Wien) verwendeten MySQL-Version 4.1 auf MySQL 5, das offensichtlich die teilweise sehr komplexen Abfragen besser optimieren kann.
- Speicher-Upgrade des Publikationsdatenbank-Servers (soweit technisch machbar).
- Konzeption der Datenbank-Software in einer Form, die dort, wo ein Zugriff auf den Gesamt-Datenbestand nicht erforderlich ist (z.B. Publikationsliste eines Instituts), jedenfalls die zu durchsuchenden Datenmengen sinnvoll einschränkt.
Unter MySQL 5 und mit 2 Gigabytes RAM (statt bisher 1 Gigabyte am Publikationsdatenbank-Server der TU Wien) sind jedenfalls auch unter Verwendung der bisher verwendeten Such-Algorithmen Volltext-Suchoperationen im gesamten Bestand von 64.000 Publikations-Datensätzen ohne prohibitive Verzögerungen möglich. Die MySQL-"fulltext"-Suche ist, wie erwähnt, noch um etwa eine Größenordnung schneller.
Die Zusammenfassung der Einzel-Datenbanken wirkt sich ohne die oben beschriebenen "flankierenden Maßnahmen" nicht nur negativ auf die Performance des Systems aus, sie hat auch wenig wünschenswerte Konsequenzen für die Usability der Software: Nicht nur die zu bearbeitenden Publikationseinträge müssen aus einer Auswahlliste ausgewählt werden; Gleiches gilt auch für die Autor/innen und Herausgeber/innen sowie für die Publikationsmedien. Der Umfang aller dieser Auswahllisten würde durch die Zusammenlegung um ein Vielfaches anwachsen, wobei noch dazu die zu den bisherigen Einträgen einer Fakultät hinzukommenden Datensätze oftmals ohne jede Relevanz für die Fakultät sind. Es wurden daher die folgenden Lösungen gewählt:
- Mit Ausnahme von Personen mit speziellen Berechtigungen erhalten die User nach einem Login ins Administrationsprogramm ausschließlich die Publikationen der Fakultät (oder gegebenenfalls der Fakultäten) angeboten, für die sie Editierrechte haben. Die maximale Anzahl von Publikationseinträgen in einer Auswahlliste des Administrationsprogramms bleibt also für Nicht-Administrator/innen in der Größenordnung der bisherigen Fakultäts-Publikationsdatenbanken; negative Auswirkungen auf die Performance des Systems (und damit auf die Ladezeiten der Seiten), selbst bei Auswahl aller Publikationseinträge einer Fakultät, bleiben daher in tolerierbaren Grenzen.
- Sollte ein User Zugriffsrechte für mehrere Fakultäten haben, werden diese nur nach einem "globalen Login" zur Auswahl angeboten. (Dies betrifft in der Regel nur Administrator/innen.) Bei einem Login aus der Startseite einer Fakultät stehen immer nur die Publikationsdaten der gewählten Fakultät zur Auswahl.
- Grundsätzlich kann jede Benutzerin / jeder Benutzer gleichzeitig für alle Fakultäten, in denen sie / er Zugriffsberechtigungen hat, je eine "lokale" Session aus der Startseite einer Fakultät heraus offen halten. Wenn diese Benutzerin / dieser Benutzer gleichzeitig eine globale Login-Session öffnet, besteht jedoch bei den Fakultäten, in denen bereits eine lokale Session der Benutzerin / des Benutzers aktiv ist, innerhalb der globalen Session nur mehr Lese-Zugriff. Damit kann die versehentliche Bearbeitung ein und desselben Publikations-Datensatzes in zwei unterschiedlichen Sessions verhindert werden.
- Die aktuellen Einstellungen im Administrationsprogramm werden für alle Fakultäten separat gespeichert und bei der Auswahl einer Fakultät im Hauptmenü wieder zur Verfügung gestellt.
- Bei der Auswahl der an einer Publikation beteiligten Personen (Autor/innen, Herausgeber/innen usw.) auf der Seite "Publikationseintrag editieren" werden die Personeneinträge der Angehörigen aller Institute der TU Wien zuzüglich der Datensätze der "Externen" der aktuellen Fakultät durchsucht. Da erfahrungsgemäß etwa 80% der Personen-Datensätze auf Externe ("Kein Angehöriger der Fakultät" bzw. "Kein Angehöriger der TU Wien") entfallen, bleibt der Zuwachs an Datensätzen - die Angehörigen der anderen Fakultäten - in tolerablen Grenzen. Die Einschränkung auf die "eigenen" Externen der Fakultät ist auch aus anderen Gesichtspunkten kein Nachteil: Gerade Personen, die der Fakultät nicht angehören, werden in der Regel (in Ermangelung vollständiger Informationen bei den Eintragenden) nur mit abgekürzten Vornamen in der Datenbank registriert. Dies resultiert oftmals in sehr wenig eindeutigen Namens-Einträgen, und gelegentlich werden wohl unterschiedliche physische Personen durch den gleichen Namenseintrag repräsentiert werden. So lange dies innerhalb einer Fakultät geschieht, sind solche "Mehrfachbelegungen" des gleichen Namenseintrags noch nicht allzu auffällig; würden aber allePersoneneinträge zur Auswahl angeboten, könnte der gleiche Namenseintrag beispielsweise sowohl in Publikationseinträgen der Teilchenphysik als auch in solchen der Landschaftsplanung verwendet werden, was zumindest etwas verwunderlich aussähe.
- Analog werden auch bei den Publikationsmedien nur die Einträge der aktuellen Fakultät zur Auswahl angeboten. Hier ist das primäre Ziel, irrelevante Publikationsmedien auszublenden und ihre mögliche irrtümliche Verwendung hintanzuhalten. Zudem kann es auch - je nach Organisation der zugehörigen Abläufe - vorteilhaft oder überhaupt Voraussetzung sein, bei der Validierung der Publikationsmedien ausschließlich die neu hinzugekommenen Datensätze der aktuellen Fakultät anzubieten.
- In beiden Fällen - Namens- und Publikationsmedien-Datensätze - wurde auch die Möglichkeit vorgesehen, bestimmte Datensätze als "global" zu definieren. Solche Datensätze werden in allen Fakultäten in gleicher Weise zur Auswahl angeboten; sie sind in den Auswahllisten durch den Zusatz "[global]" gekennzeichnet. Dies macht beispielsweise bei SCI- (SSCI-, A&HCI-) Zeitschriften Sinn, die eindeutig und objektiv auf der Basis ihres Aufscheinens in einem der genannten Indizes (auch automatisch) klassifiziert werden können. Während "gewöhnliche" Namens- oder Publikationsmedien-Datensätze mit gleichen Inhalten in beliebig vielen Fakultäten parallel existieren dürfen, müssen "globale" Datensätze Datenbank-weit eindeutig sein, da "globale" Datensätze so behandelt werden, als ob sie der aktuellen Fakultät angehören würden. Es dürfen also auch nicht gleichartige Namens- oder Medien-Datensätze als globale Datensätze und innerhalb einer Fakultät vorkommen.
- Die Verwendung der beschriebenen "virtuellen Fakultäts-Tabellen" für externe Personen und Publikationsmedien erleichtert zudem die Zusammenführung der bisher separierten Datenbanken: Datensätze brauchen nur innerhalb ihrer eigenen Fakultäten eindeutig zu sein; gleichnamige Personen oder Publikationsmedien dürfen aber in unterschiedlichen Fakultäten vorkommen. Ihre Existenz hat keinen negativen Einfluss auf die Integrität und Konsistenz der Datenbank (bzw. auf die bei ihrer Prüfung generierten Fehlermeldungen); sie können aber gegebenenfalls ohne extremen Zeitdruck in "globale" Datensätze konvertiert werden, soweit dies Sinn macht.
Die Zugriffsberechtigungen der bisherigen Datenbank-Struktur wurden weitestgehend beibehalten, aber in gewissen Bereichen angepasst:
- Wie oben erwähnt, ist im Administrationsprogramm der Zugriff auf die Publikationseinträge der Fakultäten eingeschränkt, für die Zugriffsrechte bestehen. (Unabhängig von ihren / seinen Zugriffsrechten kann wie bisher jede Benutzerin / jeder Benutzer der Publikationsdatenbank alle Publikationseinträge der Fakultät einsehen, aber nur einen Teil davon bearbeiten). Eine Auswahl von Publikationseinträgen anderer Fakultäten ist jedoch im Administrationsprogramm nicht möglich. Hingegen können alle Namens-, Medien- und Projekt-Einträge der gesamten Datenbank eingesehen, jedoch ebenfalls nur im Rahmen der eigenen Berechtigungen bearbeitet werden. (Bei diesen Einträgen ist die Serverbelastung selbst bei Erstellung von Gesamtlisten nicht so groß wie bei Publikationen; zumindest bei Namens- und Projekt-Einträgen ist die Möglichkeit des Zugriffs auf die Einträge anderer Fakultäten als der eigenen jedenfalls Voraussetzung für die Erstellung und Bearbeitung Fakultäts-übergreifender Publikationseinträge.)
- Zugriffsrechte bestehen jedenfalls auf alle Publikations-Datensätze, in denen der aktuelle User (oder eine Person aus ihrem / seinem Berechtigungs-Bereich - Gruppe, Institut oder Fakultät) als Autor/in oder wesentlich beteiligte Person (z.B. Begutachter/in einer Dissertation) aufscheint, gleichgültig, wo und von wem der Eintrag angelegt wurde. Publikationen, deren Autor/innen aus verschiedenen Fakultäten stammen, sind also unabhängig davon, von wem sie eingetragen wurden, für alle ihre Autor/innen in gleicher Weise bearbeitbar und werden auch in den Evaluierungsabfragen unabhängig davon gewertet, wo oder von wem sie eingetragen wurden.
- Analog werden natürlich auch Publikationen einer Person unabhängig davon, wo sie eingetragen wurden, in die Publikationslisten der Person (oder ihrer Organisationseinheit) aufgenommen.
- Für Spezialzwecke wurde eine niedrigste Berechtigungsstufe "Keine" vorgesehen, die zwar ein Login in das Administrationsprogramm und lesenden Zugriff auf alle Daten zulässt, aber keinerlei Änderungen erlaubt. (Diese Berechtigungsstufe kann aber mit der speziellen Berechtigung zum Ausführen von Evaluierungsabfragen verbunden werden, um so beispielsweise Personen der Verwaltung, die keine Editierrechte in der Datenbank benötigen, einen Zugriff auf die Evaluierungs-Funktionen zu erlauben.)
- Damit stehen die folgenden Berechtigungs-Stufen zur Verfügung:
- 0 ... Keine (Login möglich, aber keine Änderungen an Einträgen)
- 1 ... Nur eigene Einträge
- 2 ... Einträge der eigenen Gruppe
- 3 ... Einträge des eigenen Instituts
- 4 ... Einträge der Fakultät ("Fakultäts-Administrator") - schließt Recht zum Ausführen von Evaluierungsabfragen ein
- 5 ... Alle Einträge ("Spezial-Administrator") - schließt Recht zum Ausführen von Evaluierungsabfragen ein
- 6 ... Alle Einträge ("Master-Administrator") - schließt Recht zum Ausführen von Evaluierungsabfragen ein
(Master-Administrator-Accounts sind fix in die Datenbank eingebaut; diese Berechtigungsstufe kann nicht an "gewöhnliche" User vergeben werden.)
- Für die Berechtigungsstufen 0, 1, 5 und 6 wurde die Möglichkeit vorgesehen, "globale Zugriffsrechte" zu erteilen. User mit "globalen Zugriffsrechten", die über ein "globales Login" in die Datenbank eingestiegen sind, bekommen im Gegensatz zu allen anderen Usern im Hauptmenü auch die Option "Gesamte Publikationsdatenbank (alle Fakultäten)" angeboten. (In den Auswahlmenüs für Namens- und Medieneinträge steht diese Option allen Benutzerinnen und Benutzern zur Verfügung.) Weiters stehen ihnen in den ausschließlich für Administrator/innen zugänglichen Funktionen der Publikationsdatenbank verschiedene zusätzliche Optionen zur Verfügung. "Globale Zugriffsrechte" ersetzen die Zugriffsrechte in den einzelnen Fakultäten, gelten also für alle Fakultäten in gleicher Weise. Sie machen nur Sinn für User, die entweder keine oder minimale Zugriffsrechte (aber das explizit gewährte Recht auf die Ausführung von Evaluierungsabfragen) haben, oder die globale Administrator-Rechte besitzen.
- Hinweis: Grundsätzlich könnten auch an "gewöhnliche" User Rechte in mehreren Fakultäten vergeben werden. Da aber jeder User genau einem Institut genau einer Fakultät zugeordnet ist (das es in anderen Fakultäten nicht gibt), sind Benutzerrechte in anderen Fakultäten nur sinnvoll, wenn dem User dort Fakultäts-Administrator-Rechte gegeben werden, die dann die Bearbeitung aller Einträge der Fakultät gestatten.
Die mit Version 3 der Publikationsdatenbank eingeführte Möglichkeit, Fakultäts-übergreifende Publikationseinträge (mit Autor/innen aus unterschiedlichen Fakultäten) zu erstellen, brachte eine weitere Komplikation mit sich: An der TU Wien muss jede Publikation genau einem Fakultäts-Schwerpunkt zugeordnet werden. Um das Paradigma beibehalten zu können, dass eine Publikation in exakt gleicher Weise für alle an ihr beteiligte Personen (bzw. ihre Institute) behandelt wird, gleichgültig, durch wen der zugehörige Eintrag erstellt wurde, musste auch die Möglichkeit geschaffen werden, bei Bedarf die Publikation je einem primäres Forschungsgebiet der Fakultät aller beteiligten Fakultäten zuordnen zu können. (Der Einfachheit halber, und um künftigen Anforderungen leichter entsprechen zu können, ist, sofern dieses Feature in der aktuellen Implementierung aktiviert ist, für die Fakultäten aller an einer Publikation beteiligten Personen, also Autor/innen und Herausgeber/innen usw., je ein primäres Forschungsgebiet der Fakultät auszuwählen.)
Speziell im Bereich der Zugänge zur Publikationsdatenbank wurde auf eine vollständige Beibehaltung der Kompatibilität mit dem bisherigen Verhalten geachtet: An zahlreichen Instituten der TU Wien werden von Instituts-Websites Publikationsdaten in der einen oder anderen Form von der Publikationsdatenbank angefordert; die Aufruf-Parameter der zugehörigen Abfrage-URLs sind in der Regel fix codiert und, zumal sie seit vielen Jahren unverändert angeboten wurden, für die aktuellen Webmaster nicht mehr oder nur mit inakzeptablem Mehraufwand adaptierbar. Die folgenden Maßnahmen wurden gewählt, um den Wartungsaufwand seitens der User möglichst gering zu halten:
- Obwohl, wie erwähnt, der Zugang zur kompletten Publikationsdatenbank und den Daten aller Fakultäten über eine einzige Web-Adresse möglich ist, werden die alten Einstiegs-Adressen weiterhin unterstützt. Damit können Lesezeichen (Bookmarks, Favoriten) unverändert beibehalten werden; auch die Einstiegsadressen für die zahlreichen Webservices der Publikationsdatenbank bleiben unverändert. (An der TU Wien, wo die Publikationsdatenbank in die Zeiten von PHP 3 zurückreicht, werden sogar die .php3-Einstiegsadressen weiter beibehalten. Der häufigste Zugriff an der TU Wien überhaupt erfolgt nämlich auf die Seite publist.php3.)
- Die Publikationsdatenbank unterstützt für jeden Datensatz zwei unterschiedliche IDs, jene, die in der neuen zusammengelegten Datenbank gültig ist, und jene, die in der alten Fakultäts-Publikationsdatenbank verwendet wurde. Die IDs unterscheiden sich in ihrem Wertebereich, so dass die Publikationsdatenbank bei jedem Aufrufparameter, der ihr als ID irgendeines Datensatzes (beispielsweise für eine Person, ein Institut oder eine Publikation) übergeben wurde, sofort erkennen kann, ob es sich um eine "alte" oder eine "neue" ID handelt. Da bestehende vorprogrammierte Aufrufe immer über die Einstiegsadresse einer alten Fakultäts-Publikationsdatenbank erfolgen werden, ist über die ID der Fakultäts-Publikationsdatenbank und die alte Datensatz-ID eine eindeutige Umsetzung auf die neue ID und damit Identifikation der gewünschten Daten gegeben. "Neue" IDs werden, unabhängig davon, ob ein Aufruf einer Webservice-Funktion über die zentrale Zugangsadresse oder die einer alten Fakultäts-Publikationsdatenbank erfolgte, sofort korrekt interpretiert. (Das impliziert, dass für die Webservices unter der zentralen Zugangsadresse ausschließlich "neue" IDs verwendet werden können.)
- Zur Vermeidung von Anpassungs-Schwierigkeiten der User wurde auch das bisherige Erscheinungsbild der Publikationsdatenbank, insbesondere ihrer Einstiegsseiten, so wenig wie möglich geändert. (Ungeachtet dessen mussten jedoch erhebliche Teile des Programmcodes völlig neu gestaltet werden.)
In Anbetracht der auf ein Vielfaches angewachsenen Komplexität der zu handhabenden Daten wurde versucht, durch ein entsprechendes Design eine möglichst einfache Handhabung, insbesondere im Bereich des Administrationsprogramms, zu gewährleisten:
- Die im Hauptprogramm gewählte (bzw. durch die Wahl der Einstiegs-Adresse und/oder die Berechtigungen des aktuellen Users vorgegebene) Fakultät ist Default, aber nicht Einschränkung, auf allen Seiten, die die Auswahl eines Instituts erlauben. Bei Auswahllisten für Institute oder primäre Forschungsgebiete der Fakultät werden immer zuerst die Einträge der aktuellen Fakultät und dann erst die aller anderen angezeigt. Damit erübrigt sich vielfach ein Scrollen in überlangen Auswahllisten.
- Auswahllisten, die alle Institute oder primären Forschungsgebiete der Fakultät der gesamten Organisation umfassen, sind durch Zwischen-Überschriften in Fakultäts-Gruppen gegliedert, was das Auffinden eines Eintrags wesentlich erleichtert.
- Die Einstellungen für eine Fakultät im Administrationsprogramm werden so gespeichert, dass sie sowohl beim Einstieg in die Fakultät aus einem globalen Login als auch über die Startseite der Fakultät konsistent verfügbar sind.
Trotz der oben erwähnten umfassenden Neugestaltung der Datenbank-Abfragen sind die Bearbeitungszeiten für manche Operationen - allerdings auch infolge ihrer verbesserten logischen Leistungsfähigkeit - mit den zusammengefassten Datenbanken doch merklich größer als in früheren Versionen der Publikationsdatenbank mit ihren Einzel-Datenbanken. So nimmt beispielsweise die Suche nach potenziellen Duplikat-Einträgen bei der Abspeicherung eines Publikations-Datensatzes, die selbst bei den etwa 12.500 Einträgen der größten Einzel-Datenbank kaum merkbar war, am Publikationsdatenbank-Server der TU Wien bis zu typisch etwa fünf Sekunden (abhängig von der Anzahl der im Beobachtungs-Zeitraum überhaupt vorhandenen und der zu vergleichenden Publikationen sowie von Faktoren wie der Länge des Titels oder der Publikationsmedien-Bezeichnung) in Anspruch. (Mit den Algorithmen der alten Datenbank wären dies übrigens weit jenseits von 10 Sekunden gewesen.) Dafür wird jetzt aber auch der gesamte potenziell für Duplikat-Einträge in Frage kommende Datenbestand - bei den häufigsten Publikationstypen in der Größenordnung von 15.000 bis 20.000 Datensätzen an der TU Wien - und nicht nur eine Einzel-Datenbank nach Duplikaten durchsucht. Die Duplikat-Suchfunktion umfasst die Einträge, die im Zeitraum von einem Jahr vor bis ein Jahr nach dem abgespeicherten Publikations-Datensatz erstellt wurden. Zwangsläufig ist damit die Zeit für die Abspeicherung älterer Datensätze, bei denen die Daten von drei vollen Publikationsjahren durchsucht werden müssen, größer als für Publikationen des aktuellen Jahres, bei denen nur das teilweise befüllte aktuelle und das vollständig befüllte Vorjahr berücksichtigt werden müssen. Grundsätzlich kann durch einige operative Maßnahmen die Performance der wichtigsten Datenbank-Operationen signifikant verbessert werden:
- Bei der Eintragung oder Bearbeitung von Publikationseinträgen sollte die Auswahl so weit wie sinnvoll möglich (auf Organisationseinheit und Zeitraum) eingeschränkt werden. Die Voreinstellungen im Administrationsprogramm wurden so geändert (siehe weiter unten), dass dies in der Regel gewährleistet ist. (Publikations-Auswahllisten mit mehr als 2000 Einträgen werden aber auch noch ohne nennenswerte Verzögerungen aufgebaut.)
- Wenn nicht andere Aufgabenstellungen dagegen sprechen (z.B. die Erstellung von Publikationslisten), sollte unter "Sortiert nach" grundsätzlich "Alter" gewählt werden. Diese Sortier-Reihenfolge hat erstens den Vorteil, dass die zuletzt bearbeiteten Datensätze ganz am Anfang der Auswahlliste stehen und daher leichter gefunden werden können; sehr umfangreiche Auswahllisten (10.000 Einträge und mehr) können auch merklich schneller nach dem Alter der Einträge als nach den anderen verfügbaren Sortier-Kriterien sortiert werden.
- Insbesondere für Sekretariate, die große Datenmengen eintragen müssen, kann die Wahl der Option "als Eigentümerin / Eigentümer des Eintrags" (statt des Defaults "als Autorin / Autor bzw. wesentlich beteiligte Person") Sinn machen. Auch in diesem Fall werden Auswahllisten schneller erstellt. Zudem hat diese Option den Vorteil, dass in Bearbeitung befindliche Datensätze, bei denen noch keine Autor/innen ausgewählt wurden, zwangsläufig nur über die Auswahl nach ihren Eigentümer/innen gefunden werden können.
- Zügiges Eintragen von Publikationen bereits in der ersten Hälfte des Publikationsjahres hat den Vorteil, dass, wie erwähnt, bei der Suche nach Duplikaten beim Abspeichern der Einträge eine geringere Anzahl von Datensätzen durchsucht werden muss und die Abspeicherung daher weniger Zeit in Anspruch nimmt. (Obwohl selbst die erwähnten fünf Sekunden Verzögerungszeit bei älteren Einträgen nicht als wirklich prohibitiv zu betrachten sind.)
Mit der oben erwähnten Einführung der fulltext-Suchfunktion des MySQL-Datenbank-Backends stehen nun zwei in ihrem Verhalten und ihrer Performance komplementäre Such-Mechanismen in den öffentlich zugänglichen Seiten sowie im Administrationsprogramm zur Verfügung:
Die in den öffentlich zugänglichen Seiten standardmäßig verwendete Google-artige Suchfunktion ist schneller und liefert nach Relevanz gereihte Ergebnislisten; insbesondere bei Verwendung kurzer Such-Begriffe sind die Ergebnisse aber oft etwas unerwartet. Es werden (zumindest im Standard-Suchmodus) jene Publikationseinträge ausgewählt, die mindestens eines der Worte des Suchtextes enthalten. Weitere Informationen zur Optimierung der Anwendung der Google-artigen Suchfunktion finden Sie in der Online-Hilfe zur Textsuche.
Die strikte Text-Suchfunktion wird durch Setzen einer Checkbox "Strikte Suche" aktiviert. Sie ist - insbesondere bei fehlender oder sehr weit gefasster sonstiger Einschränkung der Publikationsauswahl - deutlich langsamer als die Google-artige Suchfunktion; sie liefert als Ergebnis eine nach Publikationsarten gruppierte Liste jener Datensätze, die alle angegebenen Suchbegriffe enthalten. Weitere Informationen zur strikten Text-Suchfunktion finden Sie in der Online-Hilfe zur Textsuche. Da bei der Dateneingabe im Administrationsprogamm die Auswahl von Publikations-Datensätzen in der Regel weitgehend (z.B. auf ein Institut) eingeschränkt ist und das Verhalten dieses Such-Algorithmus den Usern geläufig ist, wird innerhalb des Administrationsprogramms die strikte Textsuche als Default verwendet.
In jedem Fall stehen aber beide Such-Algorithmen, also auch der nicht als Standard voreingestellte, optional zur Verfügung.
Bei der Google-artigen Suchfunktion werden nur Wörter in den Publikations-Datensätzen gefunden, die genau gleich einem der angegebenen Suchbegriffe sind (oder - bei Verwendung des optionalen Operators "*" - mit einem der Suchbegriffe beginnen). Die strikte Text-Suchfunktion findet hingegen auch Datensätze, bei denen einer der Suchbegriffe als Teil eines Worts vorkommt. Daher findet die Google-artige Suchfunktion bei Angabe des Suchbegriffs "elektron" nur Datensätze, in denen das Wort "Elektron" (in beliebiger Groß- oder Kleinschreibung) existiert; die strikte Text-Suchfunktion findet hingegen auch "Mikroelektronik". (Bei Eingabe von "elektron*" würde die Google-artige Suchfunktion zwar "Elektronik", nicht aber "Mikrolektronik" finden. Ein vorangestellter "*" ("*elektron" oder "*elektron*") wird von der Google-artigen Suchfunktion ignoriert.) Einige weitere Operatoren der Google-artigen Suchfunktion erlauben eine weitere Anpassung des Such-Verhaltens; Details dazu entnehmen Sie bitte der Online-Hilfe zur Textsuche.
Bei beiden Such-Algorithmen werden die durch die übrigen Auswahlkriterien bestimmten Publikationsdatensätze durchsucht, wobei entweder jeweils der gesamte Datensatz oder nur Teile davon durchsucht werden können. Wenn das Feld "Suchen nach" leer ist, erfolgt keine Textsuche; in diesem Fall werden alle den übrigen Kriterien entsprechenden Einträge ausgegeben. Die Groß- oder Kleinschreibung des Suchbegriffs wird in jedem Fall ignoriert.
Im Zuge der Umstellung auf Version 3.00 der Publikationsdatenbank wurden auch einige Funktionen mit - hoffentlich aussagekräftigeren und besser zutreffenden - neuen Bezeichnungen versehen; auch die Bezeichnungen einzelner Datenfelder wurden überarbeitet, um sie verständlicher zu gestalten:
- Öffentlich zugängliche Seiten der Publikationsdatenbank:
- "Schnelle Suche" umbenannt auf "Suche" bzw. "erweiterte Suche";
- "Fakultäts-Publikationsdatenbanken" umbenannt auf "Publikationen der Fakultäten";
- "Suche in der Publikationsdatenbank der Fakultät" umbenannt auf "Publikationen der Fakultät";
- "Publikations- und Exportlisten aus der Publikationsdatenbank der Fakultät" umbenannt auf "Publikations- und Exportlisten der Fakultät".
- Administrationsprogramm:
- "Suchen" (im linken Menü-Frame) umbenannt auf "Publ.Listen";
- "Admin" (im linken Menü-Frame) umbenannt auf "Administration".
Die folgenden obsoleten und/oder nie verwendeten Funktionen wurden in Version 3.00 entfernt:
- "Globales Login" (ersetzt durch die Standard-Anmeldungsfunktion des Administrationsprogramms mit Publikationsdatenbank-weiter Wirksamkeit);
- "TUWIS-Login" (nur TU Wien) - nicht benötigt;
- "Alternative Publikationsstatistik" ("Metrik-Funktionen") einschließlich der nur für diese Funktionen verwendeten Parameter der Medientypen;
- einzelne nicht benötigte bzw. durch andere Funktionalität ersetzte Funktionen im Zusammenhang mit der Registrierung von Projekten an der TU Wien.
Der Rückbau der oben aufgeführten Funktionen (mit etwa 2.600 Zeilen PHP-Code) sowie eine rigorose Bereinigung des PHP-Programmcodes brachte eine geringfügige Verringerung der Code-Größe (von 59.147 Zeilen in Version 2.40 auf 58.869 Zeilen in Version 3.00beta) mit sich.
In die Liste der getesteten Browser wurde nun auch Apple Safari (in seiner Windows-Implementierung) aufgenommen. Ungeachtet des Umstandes, dass sich Safari in seinem Identifikations-String als Gecko-kompatibel ausgibt, bestehen massive Differenzen insbesondere in der Implementierung von Events zwischen Safari und den echten Gecko-Browsern (wie Firefox, Mozilla, Netscape ab Version 7 und SeaMonkey) und allen anderen getesteten Browsern. Beispielsweise erhalten Schaltflächen bei allen Browsern außer Safari beim Anklicken (sinnvoller Weise) den Eingabe-Fokus; bei Safari ist dies nur dann der Fall, wenn der User mit der Tabulator-Taste der Reihe nach durch alle Formularelemente zur gewünschten Schaltfläche navigiert hat. Für die auf zahlreichen Seiten der Publikationsdatenbank verwendeten Such-Algorithmen ist aber eine korrekte Behandlung des Eingabe-Fokus Voraussetzung für eine komfortable Interpretation des Drückens der Eingabetaste (die Benutzerinnen und Benutzer tippen einen Suchtext ein und drücken die Eingabetaste, wodurch die Suche gestartet wird). Dieses - wie die Erfahrung zeigte - sehr weit verbreitete User-Verhalten wurde und wird in der Publikationsdatenbank voll unterstützt. Bei Verwendung von Safari konnte es aber, je nach Seiten-Struktur, geschehen, dass zwar Einträge in einer Auswahlliste ausgewählt werden konnten, ein Aufruf der eigentlichen Funktionen aber nicht möglich war (beispielsweise auf der Seite "Namen und Benutzerrechte editieren - Auswahl von Namen"). Durch Änderung und Browser-spezifisches Deaktivieren des involvierten JavaScript-Codes war es möglich, auf den betroffenen Seiten zumindest die grundlegende Funktionalität von Safari zu gewährleisten; ein Start der Suche durch Drücken der Eingabetaste ist aber unter Safari gegebenenfalls nicht möglich, und ein abnormes Verhalten bei manchen User-Aktionen kann nicht ausgeschlossen werden. (Für alle anderen getesteten Browser wurde am Verhalten der betroffenen Seiten nichts geändert.)
Über die oben beschriebenen allgemeinen Änderungen hinaus wurden auch noch die folgenden Features in Version 3.00 implementiert:
- Auf der Startseite der Publikationsdatenbank wurde ein Textfeld vorgesehen, über das unmittelbar Text eingegeben werden kann, der in der Datenbank gesucht werden soll. Dabei wird die globale Textsuch-Funktion der Publikationsdatenbank mit ihren Standard-Einstellungen aufgerufen. Von der Seite mit den Suchergebnissen kann ein User bei Bedarf auf die "gewöhnliche" globale Suchseite "Suche in der Publikationsdatenbank" gelangen, wo die Such-Einstellungen bei Bedarf verfeinert werden können. Diese Seite ist nach wie vor auch direkt über Links auf der Startseite sowie den Startseiten für die Fakultäten erreichbar.
- Die Seite publications.php, die bisher nur im Kontext der TU Wien und nur für sehr spezielle Anwendungen Sinn machte, wurde nun so adaptiert, dass sie in allen Implementierungen der Publikationsdatenbank sinnvoll verwendbar ist: Sie kann mit allen Parametern aufgerufen werden, mit denen auch die Seite publist.php aufgerufen werden kann (wobei nur "neue" IDs für Institute, Gruppen und Personen unterstützt werden und die Seite auch nur im Startverzeichnis der Datenbank sowie im Verzeichnis global verfügbar ist). Die Seite publications.php ist jetzt als Wrapper für publist.php implementiert. Zusätzlich zu einer völligen Aufruf-Kompatibilität mit publist.php ist für publications.php auch ein Aufruf mit dem Parameter inst mit einer Kurzbezeichnung eines Instituts als Wert möglich. (In der Implementierung der TU Wien werden wie bisher auch interne Personen-Kennungen (OIDs - Parameter oid) und Projekt-IDs (Parameter projid) als Aufrufparameter unterstützt.) Im Gegensatz zur Seite publist.php, die eine beliebige Formatierung der Ausgabedaten zulässt, ist die Ausgabeseite von publications.php analog zur Publikationslisten-Seite der Funktion "Publikationen der Fakultät" fix formatiert.
- Der Hinweis auf eine neue Version der Publikationsdatenbank bei der Anmeldung im Administrationsprogramm wurde diskreter gestaltet: Statt einer vollen Seite wird nunmehr beim ersten Login nach einer Versions-Änderung nur ein kurzer Hinweistext am Anfang des Hauptmenüs mit einem Link auf die Seite mit den Versions-Informationen ausgegeben, der bei weiteren Aufrufen des Hauptmenüs auch nicht mehr angezeigt wird. Die bisherige Hinweis-Seite wird in erweiterter Form nur mehr für Benutzerinnen und Benutzer angezeigt, die zum ersten Mal überhaupt mit der Publikationsdatenbank arbeiten.
- Die Voreinstellungen im Hauptmenü des Administrationsprogramms (sowie die Einstellungen nach Wahl der Optionen "Eigene Organisationseinheit" und "Standardeinstellungen") schränken nunmehr die Auswahl entsprechend den aktuellen Zugriffsrechten des Users ein: für Administratoren auf "Alle, für Benutzerinnen und Benutzer mit Editierrechten für ein Institut auf "Institut", für User mit Editierrechten für eine Gruppe auf "Gruppe", usw. Damit wird weiter der versehentlichen Ausgabe überlanger Auswahllisten vorgebeugt.
- Die Texte in den Listenfeldern "Institut", "Gruppe" und "Person", die dann angezeigt werden, wenn noch eine weitere Auswahl erforderlich ist oder sein könnte, wurden wesentlich aussagekräftiger formuliert. Dies betrifft neben dem Hauptmenü des Administrationsprogramms die Seite "Namen und Benutzerrechte editieren - Auswahl von Namen" und vor allem die allgemein zugänglichen Seiten "Publikationen der Fakultät" sowie "Publikations- und Exportlisten der Fakultät".
- Die Navigation zwischen den einzelnen Ausgabeseiten der Seite "Publikationsauswahl" wurde überarbeitet und konsistenter gestaltet. Die Performance der Seite wurde wesentlich verbessert; gegenüber früheren Versionen der Datenbank ist unter gleichen Bedingungen (gleiche Anzahl der gewählten Datensätze) ein wesentlich schnellerer (etwa doppelt so schneller) Seitenaufbau zu erwarten.
- Als "ausgeblendet" markierte Namens-Datensätze werden nun nicht nur in den Auswahllisten für Autor/innen usw. ausgeblendet, sie scheinen auch in den Namens-Auswahllisten der öffentlich zugänglichen Ausgabeseiten ("Publikationen der Fakultät") nicht mehr auf. Innerhalb des Administrationsprogramms werden sie in Auswahllisten in Klammern angezeigt (mit Ausnahme der Auswahllisten für Autor/innen usw., wo sie nur für Administratoren sichtbar sind).
- Im Hauptmenü des Administrationsprogramms, also für alle User mit Login-Rechten zugänglich, wurde eine Funktion "Instituts-Datensätze editieren" implementiert, mit der die Bezeichnungen der Institute, ihre Default-Gruppenbezeichnungen, ihre Default-Wissenschaftszweige und ihre Sichtbarkeit in Auswahllisten eingestellt werden können. Spezial-Administratoren haben zusätzlich auch die Möglichkeit, neue Instituts-Datensätze zu erstellen und Instituts-Datensätze zwischen Fakultäten zu verschieben. In diesem Fall werden automatisch die folgenden Modifikationen vorgenommen:
- Alle Gruppen sowie Personen, die dem Institut zugeordnet sind, werden zusammen mit dem Institut der gewählten Fakultät zugeordnet.
- Alle Publikationseinträge, deren Eigentümer/innen dem Institut angehören, werden ebenfalls der gewählten Fakultät zugeordnet.
- Publikationsmedien, die in den betroffenen Publikationseinträgen verwendet werden, werden wie folgt gehandhabt:
- Medieneinträge, die in der gewählten Fakultät noch nicht existieren, werden dorthin kopiert oder verschoben, je nachdem, ob sie anderweitig in Verwendung sind oder nicht.
- Wenn in der gewählten Fakultät bereits ein passender Medien-Datensatz existiert, wird dieser in den verschobenen Publikationseinträgen referenziert. Der ursprüngliche Medien-Datensatz wird dann gelöscht, wenn er in keinem anderen Publikations-Datensatz mehr in Verwendung ist.
- Globale Publikationsmedien-Einträge werden von diesen Aktionen ausgenommen.
- Namenseinträge für externe Personen ("kein(e) Angehörige(r) der Fakultät"), die in betroffenen Publikationseinträgen verwendet werden, werden wie folgt gehandhabt:
- Namenseinträge, die in der gewählten Fakultät noch nicht existieren, werden dorthin kopiert oder verschoben, je nachdem, ob sie anderweitig in Verwendung sind oder nicht.
- Wenn in der gewählten Fakultät bereits ein passender Namens-Datensatz existiert, wird dieser in den verschobenen Publikationseinträgen referenziert. Der ursprüngliche Namens-Datensatz wird dann gelöscht, wenn er in keinem anderen Publikations-Datensatz mehr in Verwendung ist.
- Globale Namens-Einträge werden von diesen Aktionen ausgenommen.
- Die je nach Implementierung den betroffenen Publikationen zugeordneten primären Forschungsgebiete der Fakultät bleiben erhalten, werden aber der gewählten Fakultät zugeordnet. Dort sind sie zwar nicht "legal"; die zugehörige Information bleibt aber jedenfalls erhalten und kann nach Maßgabe der Notwendigkeiten und Möglichkeiten geeignet ausgewertet werden. (Das Szenario der Verschiebung eines Instituts zwischen Fakultäten ist jedenfalls kein extrem wahrscheinliches.)
- Die nur für Administrator/innen verfügbaren Funktionen wurden der neuen Datenbank-Struktur entsprechend angepasst. Je nach Berechtigungen - Fakultäts-Administrator, Spezial-Administrator oder Master-Administrator - und Vorhandensein globaler Zugriffsrechte (jedenfalls für Master-Administratoren, in der Regel auch für Spezial-Administratoren) stehen unterschiedlich weit reichende Bearbeitungs-Möglichkeiten für Datensätze zur Verfügung. Grundsätzlich sind Änderungen, auch potenzielle, an irgendwelchen Datensätzen nur bei Vorhandensein ausreichender Berechtigungen in der Fakultät möglich, der die Datensätze zugeordnet sind. Damit ergeben sich auch keine gravierenden Änderungen im Erscheinungsbild der Administrations-Funktionen für Fakultäts-Administratoren gegenüber den bisherigen Versionen der Publikationsdatenbank.
- Die Funktionen für den Import und die Verwaltung der SCI-, SSCI- und A&HCI-Zeitschriftenlisten von der Website von Thomson Scientific, die bisher als Publikationsdatenbank-Plugin implementiert waren, sind nun fixer Bestandteil der Administrations-Seiten (und nur für Spezial-Administratoren mit globalen Zugriffsrechten zugänglich). Ebenso wurden zwei weitere bisher nur als Publikationsdatenbank-Plugins verfügbare Funktionen, "Liste der einer Organisationseinheit angehörigen Personen" und "Liste der einer Organisationseinheit zugeordneten Gruppen" fix in die Administrations-Funktionen aufgenommen. Im Gegenzug wurde die eigentlich nur ein einziges Mal benötigte Funktion für die Prüfung der ISBN-Informationen in Publikationseinträgen in ein Publikationsdatenbank-Plugin umgewandelt.
|