[Fenster schließen]    [Hilfe-Übersicht]

Publikationsdatenbank - Hilfe zur Funktion "Erstellung eines Publikations-Archivs"

Publikations-Archive erlauben Wissenschafterinnen und Wissenschaftern, die die Publikationsdatenbank als Repositorium für ihre Publikationen verwenden, bei Bedarf (beispielsweise für die Vorbereitung einer Bewerbung) nicht nur eine Publikationsliste erstellen zu können, sondern gemeinsam mit dieser und verlinkt aus der Publikationsliste heraus die sinnvoll verfügbaren Volltext-Versionen ihrer Publikationen für eine Weitergabe beispielsweise auf einer CD-ROM zur Verfügung stellen zu können.

Ein Publikations-Archiv besteht aus einem komprimierten tar-Archiv (Dateitype tgz), das auf allen gängigen Plattformen mit Programmen wie beispielsweise (für eine Windows-Umgebung) WinZip oder WinRAR entpackt und genutzt werden kann. Das Archiv enthält die folgenden Informationen:

  • Eine formatierte Publikationsliste im HTML-Format (Datei index.html), deren Inhalt, Struktur, Sprache und Sortierordnung den Einstellungen im Hauptmenü bzw. auf der Seite "Publikations- und Exportlisten erstellen" entspricht. Aus technischen und Effizienzgründen wird immer eine nummerierte Liste ohne Erweiterungen (also Links auf Abstracts u.dgl.), Autoren- und Zusatz-Informationen sowie Markierungen hochwertiger Publikationen ausgegeben, selbst wenn diese Optionen auf der Seite "Publikations- und Exportlisten erstellen" aktiviert sein sollten. Sofern für einen Publikationseintrag eine elektronische Volltext-Version ausfindig gemacht und in das Archiv eingebunden werden konnte, ist der Titel der Publikation ein Link auf die im Archiv enthaltene lokale Kopie der Volltext-Version.
  • Zwei für die Formatierung der Publikationsliste erforderliche Dateien (pubdat.css und pubdat.ico).
  • Die in der Publikationsliste referenzierten elektronischen Volltext-Versionen. Es wird sichergestellt, dass jede referenzierte und verfügbare Volltext-Datei genau einmal im Publikations-Archiv vorkommt, selbst wenn der sie referenzierende Publikationseintrag aufgrund der gewählten Publikationslisten-Struktur mehrfach aufscheinen sollte (typisch bei einer Listenstruktur nach Publikationsarten).
Bei der Auswahl der elektronischen Volltext-Versionen wird nach den folgenden Regeln gesucht, die der Reihe nach so lange abgearbeitet werden, bis eine Volltext-Version gefunden wurde:
  • Auf den Publikationsdatenbank-Server hochgeladene sichtbare elektronische Versionen. Diese werden in jedem Fall in das Publikations-Archiv aufgenommen. Es wird dabei nicht überprüft, ob die aktuelle Benutzerin / der aktuelle Benutzer Editierrechte für die sie referenzierenden Publikations-Datensätze hat.
  • Öffentlich sichtbare elektronische Versionen, die über einen Link im Publikationseintrag spezifiziert wurden, aber auf einem anderen Server liegen. Die Verwendung solcher Volltext-Versionen kann über die Option "Bei Bedarf auch Dateien auf externen Servern in das Publikations-Archiv aufnehmen" auf der Seite "Publikations- und Exportlisten erstellen" aktiviert oder deaktiviert werden. Es wird nicht überprüft, ob die aktuelle Benutzerin / der aktuelle Benutzer Editierrechte für die sie referenzierenden Publikations-Datensätze hat. Die über den Link "Öffentlich sichtbare elektronische Version der Publikation" im Publikationseintrag spezifizierten Dateien werden nur dann nicht in das Archiv aufgenommen, wenn sie eines der folgenden Kriterien erfüllen:
    • Keine Dateitype erkennbar (z.B. "http://www.server.com/pub/"). In der Regel wird es sich bei solchen Seiten um Index-Seiten im HTML-Format handeln, die aufgrund des nächsten Kriteriums von der Aufnahme ins Archiv ausgeschlossen sind; selbst wenn dies nicht der Fall sein sollte, würden bei einem lokalen Aufruf von Dateien ohne Dateitype dem Browser die sonst vom Webserver beigestellten Informationen zur Datei (konkret ihre MIME-Type) fehlen, ohne die eine korrekte Wiedergabe unmöglich wäre.
    • Dateien im HTML- oder XML-Format, also auch die Ausgaben von aktiven Webseiten (z.B. Dateien mit den Typen php, cgi oder asp). Da diese Seiten oftmals kaum oder überhaupt nicht brauchbar sind, wenn sie aus der Umgebung ihrer Website herausgerissen werden, macht es wenig Sinn, sie in ein Archiv aufzunehmen.
    • Ausführbare Dateien (z.B. Dateien mit den Typen exe oder dll) (aus Sicherheitsgründen).
  • Auf den Publikationsdatenbank-Server hochgeladene "verborgene" elektronische Versionen. Die Verwendung solcher Volltext-Versionen kann über die Option "Bei Bedarf auch "verborgene" hochgeladene Dateien in das Publikations-Archiv aufnehmen" auf der Seite "Publikations- und Exportlisten erstellen" aktiviert oder deaktiviert werden. Bei Aktivierung dieser Funktionalität werden jedenfalls nur solche elektronische Versionen ins Publikations-Archiv übernommen, die Einträgen zugeordnet sind, für die die aktuelle Benutzerin / der aktuelle Benutzer Editierrechte hat. Dies ist auf jeden Fall dann garantiert, wenn der aktuelle User oder - je nach Berechtigung - eine Person aus dem Bereich der Editierrechte des aktuellen Users als Autorin oder Autor an einer Publikation beteiligt war oder den Eintrag erstellt hatte. Zur Wahrung des Schutzes der gegebenenfalls eingebundenen "verborgenen" elektronischen Versionen wird das Archiv dann, wenn die Option "Bei Bedarf auch "verborgene" hochgeladene Dateien in das Publikations-Archiv aufnehmen" auf der Seite "Publikations- und Exportlisten erstellen" aktiviert war, im gleichen Verzeichnis wie die "verborgenen" hochgeladenen Dateien angelegt. Zugriffe auf dieses Verzeichnis können jedoch - je nach Implementierung - in der Webserver-Konfiguration auf bestimmte Adressbereiche (typisch ein Intranet) eingeschränkt sein, so dass möglicherweise zwar die Erstellung eines Archivs weltweit möglich ist, der Abruf des Archivs dann aber durch die Webserver-Konfiguration verhindert wird.
  • Links auf Volltext-Versionen von Publikationen auf einem externen Server, die deshalb nicht in ein Publikations-Archiv aufgenommen werden können, weil das Ziel des Links eine HTML-Seite oder eine aktive Webseite ist. Die Aufnahme dieser Links in das Publikations-Archiv kann über die Option "bei Bedarf Links auf jene externen Volltext-Versionen erstellen, die nicht ins Archiv eingebunden werden können" gesteuert werden. Bei (statischen oder aktiven) Webseiten als Ziel eines Links wäre eine korrekte Repräsentation der Inhalte dieser Seiten (die ja potenziell auch auf beliebig viele andere Seiten weiter verweisen können) innerhalb des Publikations-Archivs nicht gewährleistet. Durch Setzen der Option "bei Bedarf Links auf jene externen Volltext-Versionen erstellen, die nicht ins Archiv eingebunden werden können" werden solche Links direkt in die Publikationsliste des Publikations-Archivs übernommen. Dieses ist damit zwar nicht mehr selbst-konsistent, weil für die betroffenen Einträge auf das Internet zugegriffen werden muss; es ist aber damit wirklich vollständig. Es bleibt der Benutzerin / dem Benutzer freigestellt, ob der Selbst-Konsistenz oder der Vollständigkeit des Archivs größeres Gewicht zugemessen wird. Links auf externe Seiten werden jedenfalls nur dann eingebunden, wenn keine (zugängliche) andere elektronische Version der Publikation existiert. Die Option "bei Bedarf Links auf jene externen Volltext-Versionen erstellen, die nicht ins Archiv eingebunden werden können" impliziert die Option "bei Bedarf auch Dateien auf externen Servern in das Publikations-Archiv aufnehmen"; die beiden Options-Checkboxen sind dementsprechend miteinander verknüpft.

Beim Aufruf der Seite "Publikations- und Exportlisten erstellen" ist die Checkbox "Publikations-Archiv erstellen" nicht gesetzt, und es wird unter ihr eine Schaltfläche "Inhalt des Publikations-Archivs prüfen" angezeigt. In diesem Betriebsmodus kann vor der eigentlichen Erstellung eines Publikations-Archivs (aber auch unabhängig davon) geprüft werden, ob alle in das Archiv einzubindenden elektronischen Volltext-Versionen tatsächlich verfügbar sind. Damit können auch "broken links" auf elektronische Versionen auf externen Servern erkannt und gegebenenfalls durch Hochladen eines geeigneten Dokuments auf den Publikationsdatenbank-Server korrigiert werden. Die in diesem Betriebsmodus erstellte Ausgabeliste wird bewusst je nach Browser in einem separaten Fenster geöffnet oder als Download-Datei zur Verfügung gestellt, um die in ihr gegebenenfalls vorhandenen Fehlermeldungen und Strings mit Publikations-IDs leichter zugänglich zu machen. (Wenn ein Datensatz-ID-String - z.B. "Datensatz-ID: publik.tuwien.ac.at/|123456" - vollständig in das Feld "Suchen nach" im Hauptprogramm des Administrationsmenüs kopiert und anschließend eine der Funktionen des Hauptmenüs, z.B. "Publikationen eintragen und editieren", aufgerufen wird, wird der entsprechende Datensatz direkt im Editierformular geöffnet.)

Beim Setzen der Checkbox "Publikations-Archiv erstellen" ändert sich der Text auf der darunter stehenden Schaltfläche in "Publikations-Archiv erstellen"; erst dann wird tatsächlich ein Publikations-Archiv aufgebaut.

Das Publikations-Archiv wird je nach Einstellung der Option "Bei Bedarf auch "verborgene" hochgeladene Dateien in das Publikations-Archiv aufnehmen" in einem Unterverzeichnis des Verzeichnisses für sichtbare bzw. "verborgene" Dateien angelegt. Der Name dieses Unterverzeichnisses besteht aus einer zufälligen Sequenz von 32 Hexadezimal-Zeichen (konkret einem 128-Bit-md5-Schlüssel); ein Zugriff Unbefugter auf das Archiv wird damit praktisch ausgeschlossen. Die Archiv-Datei selbst trägt den Namen "PubArchive.tgz" und ist nach der Fertigstellung des Archivs die einzige Datei in diesem Unterverzeichnis.

Die Erstellung von Publikations-Archiven ist sehr Ressourcen-aufwändig. Insbesondere das Zusammenpacken und Komprimieren des Archivs kann bei umfangreicheren Archiven mehrere Minuten in Anspruch nehmen, während derer der Server sehr stark belastet ist. Die Größe des Archivs kann je nach Zahl und Umfang der Volltext-Dateien mehrere 100 Megabytes betragen. Es sollte daher die Erstellung speziell von umfangreichen Archiven nicht unnötig oft erfolgen. Da Publikations-Archive nur von Personen angelegt werden können, die über Zugriffsrechte in der Publikationsdatenbank verfügen, und ihre Erstellung sowie ihr Umfang registriert werden, können Missbräuche sehr schnell erkannt und gegebenenfalls geahndet werden.

Nach dem Start der Erstellung des Archivs wird am Bildschirm zunächst zur Kontrolle der Kopf der Publikationsliste sowie der Name des Verzeichnisses, in dem das Archiv angelegt wird, angezeigt. Anschließend werden - je nach gewählter Listen-Struktur - Zwischentitel der Publikationsliste sowie ein "*" für jeden bearbeiteten Publikationseintrag ausgegeben. Im Falle von Fehlern, wenn eine Volltext-Version aus welchen Gründen immer nicht (mehr) verfügbar sein oder - speziell bei Dateien auf externen Servern - nicht den oben beschriebenen Regeln entsprechen sollte, werden hier auch diesbezügliche Meldungen unter Angabe der Datensatz-ID und des Publikationseintrags selbst angezeigt. Sobald das Archiv fertig gestellt ist, wird ein Link auf die Archiv-Datei und eine Zusammenfassung der Archiv-Erstellung angezeigt und eine Mail mit den gleichen Informationen an den aktuellen User geschickt. Es braucht also das Publikations-Archiv nicht unbedingt unmittelbar nach seiner Erstellung vom Server abgerufen zu werden.

Publikations-Archive werden nach ihrer Erstellung 24 Stunden lang am Server für einen Download bereit gestellt und anschließend automatisch gelöscht, um den von ihnen belegten Massenspeicherplatz wieder freizugeben.