Publikationsdatenbank - Versions-Info

	[Fenster schließen] [Hilfe-Übersicht]
	Neu in Version 3.11 (23.12.2008)
	Da bei Weitem die meisten User-Aktionen im Administrationsprogramms auf die Eintragung oder Bearbeitung von Publikations-Datensätzen entfallen, für die eine Sortierung nach Alter der Einträge (also mit den jüngsten Einträgen am Anfang der Liste) vorteilhaft ist, wurde die Default-Sortierordnung für Publikationen im Administrationsprogramm von "Autorinnen / Autoren" auf "Alter" geändert. Dies wirkt sich ausschließlich für neue User sowie für bestehende Benutzerinnen und Benutzer nach Betätigung von "Standardeinstellungen" aus; ansonsten bleibt die einmal gewählte Sortierordnung - auch über Sessions hinaus - so lange erhalten, bis sie explizit geändert wird. Gleichzeitig wurde die Einstellung der Sortierordnung (und auch die der Ausgabesprache) für Publikationslisten von den entsprechenden Einstellungen im Hauptmenü entkoppelt, die sich jetzt nur mehr auf die Sortierordnung in der Auswahlliste (Seite "Publikationsauswahl") bzw. die Sprache der Publikationsreferenzen in der Funktion "Eintrag anzeigen" auf der Seite "Publikationseintrag editieren" bezieht. Ein seit der Zusammenführung der Einzel-Datenbanken in Version 3.00 vorhandenes latentes Problem konnte nachhaltig bereinigt werden: Wenn für einen Publikationseintrag, für den noch vor der Zusammenführung der Datenbanken eine elektronische Version der Publikation auf den Server hochgeladen worden war, nach der Zusammenführung eine elektronische Version erneut hochgeladen wurde, wurde diese unter einem neuen Namen in der Publikationsdatenbank angelegt, während die ursprüngliche Datei verschwand. (Die Namen hochgeladener Dateien ergeben sich aus einem Identifikator für die Datenbank und dem Schlüsselwert des Publikationseintrags. Beide Komponenten mussten im Zuge der Zusammenführung der Datenbanken geändert werden.) Während dies für die nur Datenbank-intern verwendeten "verborgenen" und "zusätzlichen" hochgeladenen Dateien irrelevant ist, weil die Links auf diese Dateien immer dynamisch mit dem aktuell gültigen Wert erstellt werden, verursachte dies bei den "sichtbaren" elektronischen Versionen in jenen Fällen Probleme, in denen außerhalb der Publikationsdatenbank (statische) Links auf diese Dateien angelegt worden waren, die zwangsläufig mit der Umbenennung der hochgeladenen Dateien ungültig wurden. Diesem Problem wird nun so begegnet, dass bei "alten", also aus der Zeit vor der Zusammenführung der Datenbanken stammenden, Publikationseinträgen zusätzlich zum regulären Verzeichnis-Eintrag der hochgeladenen Datei mit dem "neuen" Namen über einen Hard Link ein zweiter Verzeichniseintrag mit dem "alten" Namen erstellt wird. Beide Varianten des Dateinamens werden gemeinsam verwaltet; wenn die hochgeladene Datei gelöscht oder überschrieben wird, werden beide Verzeichniseinträge parallel gelöscht oder modifiziert. Diese Maßnahme ist absolut Ressourcen-schonend und gewährleistet ein unbefristetes Weiterbestehen einmal definierter Dateinamen (vorausgesetzt, die hochgeladene Datei wird nicht ersatzlos gelöscht). Im Zuge der Implementierung dieser Funktionalität in der Publikationsdatenbank der TU Wien wurden mit einem speziell dafür entwickelten Publikationsdatenbank-Plugin-Programm die durch die oben geschilderte Problematik betroffenen 46 hochgeladenen Dateien (aus 2047 Publikationseinträgen mit hochgeladenen "sichtbaren" Dateien, die noch vor der Zusammenführung der Einzel-Datenbanken erstellt worden waren) durch Einfügen von Verzeichnis-Einträgen mit ihren jeweiligen "alten" Namen korrigiert. Da es in den vergangenen Jahren immer wieder zu Missverständnissen bezüglich des Begriffs "speziell begutachtet" gekommen war, wurde dieser an allen kritischen Stellen des Administrationsprogramms durch "mit Peer Review" ersetzt. Im Zuge der Zusammenführung der Einzel-Datenbanken war in Version 3.00 die Ausführung des Duplikat-Tests aus Performance-Gründen auf die Abspeicherung neuer oder geänderter Publikationseinträge eingeschränkt worden; bei unverändertem Abspeichern von Publikationseinträgen wurde auf den Duplikat-Test (der an der TU Wien bis zu 20.000 Publikationseinträge durchsuchen muss und entsprechend zeitraubend ist) verzichtet. Dies ist möglich, weil Duplikate nicht von selbst entstehen können und ein Eintrag neu erstellt oder geändert worden sein muss, um einem anderen ähnlich zu werden. Da sich zeigte, dass dieses Verhalten für manche User irritierend war, wird jetzt der Duplikat-Test jedenfalls (also auch beim unveränderten Anspeichern eines Datensatzes) auch dann vorgenommen, wenn der Datensatz bereits früher als Duplikat erkannt worden war. Es wäre zwar grundsätzlich möglich, die in der Duplikat-Tabelle gespeicherten Informationen in der gleichen Form wie die Ergebnisse des Duplikat-Tests anzuzeigen. Bei mehrfachen Änderungen eines Datensatzes kann jedoch der Fall eintreten, dass die Detailinformationen der Duplikat-Anzeige aus den gespeicherten Informationen nicht mit dem aktuellen Status übereinstimmen würden. Ein Paar von Duplikaten wird bei nämlich seiner ersten Entdeckung in der Duplikat-Tabelle registriert; dieser Eintrag wird bewusst nie mehr geändert, auch wenn einer der beteiligten Datensätze geändert wurde, um Manipulationen - der Duplikat-Datensatz wird so lange geändert, bis er nicht mehr als Duplikat erkannt wird - hintanzuhalten. Die wiederholte Ausführung des Duplikat-Tests sichert konsistente, nicht irreführende Ergebnisse; da der Anteil der Publikationseinträge mit potenziellen Duplikaten an der TU Wien in der Größenordnung von 10% liegt und ein Abspeichern eines unveränderten Publikationseintrags nicht zu den häufigsten Szenarien zählen wird, ist die durch diese Vorgangsweise verursachte Zeitverzögerung für die User und die Mehrbelastung des Servers sicher tolerierbar. Da einerseits in der Auswahlliste auf der Seite "Publikationsauswahl" eine Sortierung der Publikationseinträge nach ihrem Alter zweckmäßig ist, sich andererseits aber diese Sortierordnung in der Regel für Publikationslisten absolut nicht eignet, wurde auf der Seite "Publikations- und Exportlisten erstellen" die Möglichkeit einer individuellen Einstellung der Sortierordnung (und auch der Sprache der Publikationslisten) vorgesehen. Diese ist ebenso wie die Einstellung im Hauptmenü "sticky", bleibt also über Sessions hinweg so lange erhalten, bis sie explizit geändert wird. Ein Zurücksetzen der Einstellungen des Hauptmenüs (mit dem Link "Standardeinstellungen") hat keinen Einfluss mehr auf die für die Publikationslisten verwendeten Einstellungen. Die Einstellungen für Publikationslisten werden bei bestehenden User-Accounts bei der Implementierung von Version 3.11 einmalig aus denen des Hauptmenüs übernommen, sind aber ab dann völlig unabhängig von diesen. Bei neuen Usern ist für Publikations- und Exportlisten die Voreinstellung für die Sprache "Deutsch" und für die Sortierordnung "nach Autorinnen / Autoren". Einem Benutzer-Wunsch entsprechend wurde auf der Seite "Publikations- und Exportlisten erstellen" des Administrationsprogramms eine völlig neue Export-Funktion implementiert: Da ein immer größerer Teil der Wissenschafter/innen und Institute die Publikationsdatenbank als Haupt-Repositorium für ihre Publikationen nutzt, war der Wunsch geäußert worden, diese Daten in konzentrierter Form - als Publikationsliste mit Einbeziehung der verfügbaren elektronischen Volltext-Versionen - als Publikations-Archiv zur Verfügung zu stellen. Eine neu implementierte Schaltfläche, unterstützt durch zwei neue Optionen, erlaubt die Erstellung eines derartigen Publikations-Archivs. Ein Publikations-Archiv besteht aus einem komprimierten tar-Archiv (Dateitype `tgz`), das auf allen gängigen Plattformen mit Programmen wie beispielsweise (für eine Windows-Umgebung) WinZip oder WinRAR entpackt und genutzt werden kann. Das Archiv enthält die folgenden Informationen: Eine formatierte Publikationsliste im HTML-Format (Datei `index.html`), deren Inhalt, Struktur, Sprache und Sortierordnung den Einstellungen im Hauptmenü bzw. auf der Seite "Publikations- und Exportlisten erstellen" entspricht. Aus technischen und Effizienzgründen wird immer eine nummerierte Liste ohne Erweiterungen (also Links auf Abstracts u.dgl.), Autoren- und Zusatz-Informationen sowie Markierungen hochwertiger Publikationen ausgegeben, selbst wenn diese Optionen auf der Seite "Publikations- und Exportlisten erstellen" aktiviert sein sollten. Sofern für einen Publikationseintrag eine elektronische Volltext-Version ausfindig gemacht und in das Archiv eingebunden werden konnte, ist der Titel der Publikation ein Link auf die im Archiv enthaltene lokale Kopie der Volltext-Version. Zwei für die Formatierung der Publikationsliste erforderliche Dateien (`pubdat.css` und `pubdat.ico`). Die in der Publikationsliste referenzierten elektronischen Volltext-Versionen. Es wird sichergestellt, dass jede referenzierte und verfügbare Volltext-Datei genau einmal im Publikations-Archiv vorkommt, selbst wenn der sie referenzierende Publikationseintrag aufgrund der gewählten Publikationslisten-Struktur mehrfach aufscheinen sollte (typisch bei einer Listenstruktur nach Publikationsarten). Bei der Auswahl der elektronischen Volltext-Versionen wird nach den folgenden Regeln gesucht, die der Reihe nach so lange abgearbeitet werden, bis eine Volltext-Version gefunden wurde: Auf den Publikationsdatenbank-Server hochgeladene sichtbare elektronische Versionen. Diese werden in jedem Fall in das Publikations-Archiv aufgenommen. Es wird dabei nicht überprüft, ob die aktuelle Benutzerin / der aktuelle Benutzer Editierrechte für die sie referenzierenden Publikations-Datensätze hat. Öffentlich sichtbare elektronische Versionen, die über einen Link im Publikationseintrag spezifiziert wurden, aber auf einem anderen Server liegen. Die Verwendung solcher Volltext-Versionen kann über eine Option auf der Seite "Publikations- und Exportlisten erstellen" aktiviert oder deaktiviert werden. Es wird nicht überprüft, ob die aktuelle Benutzerin / der aktuelle Benutzer Editierrechte für die sie referenzierenden Publikations-Datensätze hat. Die über den Link "Öffentlich sichtbare elektronische Version der Publikation" im Publikationseintrag spezifizierten Dateien werden nur dann nicht in das Archiv aufgenommen, wenn sie eines der folgenden Kriterien erfüllen: Keine Dateitype erkennbar (z.B. "`http://www.server.com/pub/`"). In der Regel wird es sich bei solchen Seiten um Index-Seiten im HTML-Format handeln, die aufgrund des nächsten Kriteriums von der Aufnahme ins Archiv ausgeschlossen sind; selbst wenn dies nicht der Fall sein sollte, würden bei einem lokalen Aufruf von Dateien ohne Dateitype dem Browser die sonst vom Webserver beigestellten Informationen zur Datei (konkret ihre MIME-Type) fehlen, ohne die eine korrekte Wiedergabe unmöglich wäre. Dateien im HTML- oder XML-Format, also auch die Ausgaben von aktiven Webseiten (z.B. Dateien mit den Typen `php`, `cgi` oder `asp`). Da diese Seiten oftmals kaum oder überhaupt nicht brauchbar sind, wenn sie aus der Umgebung ihrer Website herausgerissen werden, macht es wenig Sinn, sie in ein Archiv aufzunehmen. Ausführbare Dateien (z.B. Dateien mit den Typen `exe` oder `dll`) (aus Sicherheitsgründen). Auf den Publikationsdatenbank-Server hochgeladene "verborgene" elektronische Versionen. Die Verwendung solcher Volltext-Versionen kann über eine Option auf der Seite "Publikations- und Exportlisten erstellen" aktiviert oder deaktiviert werden. Bei Aktivierung dieser Funktionalität werden jedenfalls nur solche elektronische Versionen ins Publikations-Archiv übernommen, die Einträgen zugeordnet sind, für die die aktuelle Benutzerin / der aktuelle Benutzer Editierrechte hat. Dies ist auf jeden Fall dann garantiert, wenn der aktuelle User oder - je nach Berechtigung - eine Person aus dem Bereich der Editierrechte des aktuellen Users als Autorin oder Autor an einer Publikation beteiligt war oder den Eintrag erstellt hatte. Zur Wahrung des Schutzes der gegebenenfalls eingebundenen "verborgenen" elektronischen Versionen wird das Archiv dann, wenn die Option "Bei Bedarf auch "verborgene" hochgeladene Dateien in das Publikations-Archiv aufnehmen" auf der Seite "Publikations- und Exportlisten erstellen" aktiviert war, im gleichen Verzeichnis wie die "verborgenen" hochgeladenen Dateien angelegt. Zugriffe auf dieses Verzeichnis können jedoch - je nach Implementierung - in der Webserver-Konfiguration auf bestimmte Adressbereiche (typisch ein Intranet) eingeschränkt sein, so dass möglicherweise zwar die Erstellung eines Archivs weltweit möglich ist, der Abruf des Archivs dann aber durch die Webserver-Konfiguration verhindert wird. Beim Aufruf der Seite "Publikations- und Exportlisten erstellen" ist die Checkbox "Publikations-Archiv erstellen" nicht gesetzt, und es wird unter ihr eine Schaltfläche "Inhalt des Publikations-Archivs prüfen" angezeigt. In diesem Betriebsmodus kann vor der eigentlichen Erstellung eines Publikations-Archivs (aber auch unabhängig davon) geprüft werden, ob alle in das Archiv einzubindenden elektronischen Volltext-Versionen tatsächlich verfügbar sind. Damit können auch "broken links" auf elektronische Versionen auf externen Servern erkannt und gegebenenfalls durch Hochladen eines geeigneten Dokuments auf den Publikationsdatenbank-Server korrigiert werden. Die in diesem Betriebsmodus erstellte Ausgabeliste wird bewusst je nach Browser in einem separaten Fenster geöffnet oder als Download-Datei zur Verfügung gestellt, um die in ihr gegebenenfalls vorhandenen Fehlermeldungen und Strings mit Publikations-IDs leichter zugänglich zu machen. (Wenn ein Datensatz-ID-String - z.B. "Datensatz-ID: publik.tuwien.ac.at/\|123456" - vollständig in das Feld "Suchen nach" im Hauptprogramm des Administrationsmenüs kopiert und anschließend eine der Funktionen des Hauptmenüs, z.B. "Publikationen eintragen und editieren", aufgerufen wird, wird der entsprechende Datensatz direkt im Editierformular geöffnet.) Beim Setzen der Checkbox "Publikations-Archiv erstellen" ändert sich der Text auf der darunter stehenden Schaltfläche in "Publikations-Archiv erstellen"; erst dann wird tatsächlich ein Publikations-Archiv aufgebaut. Das Publikations-Archiv wird je nach Einstellung der Option "Bei Bedarf auch "verborgene" hochgeladene Dateien in das Publikations-Archiv aufnehmen" in einem Unterverzeichnis des Verzeichnisses für sichtbare bzw. "verborgene" Dateien angelegt. Der Name dieses Unterverzeichnisses besteht aus einer zufälligen Sequenz von 32 Hexadezimal-Zeichen (konkret einem 128-Bit-md5-Schlüssel); ein Zugriff Unbefugter auf das Archiv wird damit praktisch ausgeschlossen. Die Archiv-Datei selbst trägt den Namen "`PubArchive.tgz`" und ist nach der Fertigstellung des Archivs die einzige Datei in diesem Unterverzeichnis. Die Erstellung von Publikations-Archiven ist sehr Ressourcen-aufwändig. Insbesondere das Zusammenpacken und Komprimieren des Archivs kann bei umfangreicheren Archiven mehrere Minuten in Anspruch nehmen, während auch der Server sehr stark belastet ist. Die Größe des Archivs kann je nach Zahl und Umfang der Volltext-Dateien mehrere 100 Megabytes betragen. Es sollte daher die Erstellung speziell von umfangreichen Archiven nicht unnötig oft erfolgen. Da Publikations-Archive nur von Personen angelegt werden können, die über Zugriffsrechte in der Publikationsdatenbank verfügen, und ihre Erstellung sowie ihr Umfang registriert werden, können Missbräuche sehr schnell erkannt und gegebenenfalls geahndet werden. Nach dem Start der Erstellung des Archivs wird am Bildschirm zunächst zur Kontrolle der Kopf der Publikationsliste sowie der Name des Verzeichnisses, in dem das Archiv angelegt wird, angezeigt. Anschließend werden - je nach gewählter Listen-Struktur - Zwischentitel der Publikationsliste sowie ein "" für jeden bearbeiteten Publikationseintrag ausgegeben. Im Falle von Fehlern, etwa wenn eine Volltext-Version aus welchen Gründen immer nicht (mehr) verfügbar sein oder - speziell bei Dateien auf externen Servern - nicht den oben beschriebenen Regeln entsprechen sollte, werden hier auch diesbezügliche Meldungen unter Angabe der Datensatz-ID und des Publikationseintrags selbst angezeigt. Sobald das Archiv fertig gestellt ist, wird ein Link auf die Archiv-Datei und eine Zusammenfassung der Archiv-Erstellung angezeigt und eine Mail mit den gleichen Informationen an den aktuellen User geschickt. Es braucht also das Publikations-Archiv nicht unbedingt unmittelbar nach seiner Erstellung vom Server abgerufen zu werden. Publikations-Archive werden nach ihrer Erstellung 24 Stunden lang am Server für einen Download bereit gestellt und anschließend automatisch gelöscht, um den von ihnen belegten Massenspeicherplatz wieder freizugeben. (Die Löschung erfolgt durch die gleiche Funktion, die auch nicht mehr benötigte temporäre Datensätze eliminiert.) Eine optionale farbliche Markierung hochwertiger, also einem Peer-Review-Verfahren unterzogenen oder in einem SCI-, SSCI- oder A&HCI-Medium erschienenen Publikationen ist nun auch in den mit der Seite "Abfragen vornehmen" generierten Publikationslisten sowie in allen Publikationslisten möglich, die im Rahmen der nur speziell berechtigten Usern zugänglichen Funktion "Evaluierungsdaten ermitteln" erstellt werden. In den Mailversand-Funktionen der Publikationsdatenbank wurde die Zuverlässigkeit der korrekten Wiedergabe der aus der Publikationsdatenbank versandten Mails mit unterschiedlichen Mail Clients durch Angabe zusätzlicher Header-Informationen verbessert. Allerdings setzen aus der Publikationsdatenbank versandte Mails nach wie vor von den von den involvierten Mail-Servern und Clients voraus, dass diese 8-Bit-codierte Mails korrekt behandeln bzw. wiedergeben können. Die für eine portablere Codierung des Inhalts der Mails als "Quoted-printable*" erforderlichen Funktionen stehen leider in den Standard-PHP-Implementierungen nicht zur Verfügung; ihre Installation hätte extrem aufwändige Konfigurationsmaßnahmen am Server erfordert. Jene Seite der Publikationsdatenbank, mit der gegebenenfalls Informationen wie Abstracts, Keywords und Links auf einen DOI oder eine (sichtbare) elektronische Version der Publikation angezeigt werden, wurde erweitert, um sie auch an Aufrufe von außerhalb der Publikationsdatenbank anzupassen: Die Seite war primär für einen Aufruf aus den "erweiterten Publikationslisten" der Publikationsdatenbank heraus konzipiert, wo ihr Kontext und ihre Zugehörigkeit zur Publikationsdatenbank eindeutig erkennbar waren. In XML- oder Text-basierten Exportlisten wird aber für jeden Publikationsdatensatz auch ein Link für einen Aufruf dieser Seite für den entsprechenden Publikationseintrag mitgeliefert; diese Links werden inzwischen in diversen Websites - etwa der Bibliothek der TU Wien oder in zahlreichen Instituts-Websites an der TU Wien - verwendet, wo ihr Zusammenhang mit der Publikationsdatenbank nicht immer klar erkennbar ist. Aus diesem Grund wurde auf dieser Seite bei einem Aufruf aus einem außerhalb der Publikationsdatenbank liegenden Kontext ein Verweis und Link auf die Publikationsdatenbank angebracht; bei Aufrufen aus der Publikationsdatenbank heraus unterbleibt dieser Verweis.

[Fenster schließen] [Hilfe-Übersicht]