Dokumentenserver sind eine der beiden Säulen der "Open Access" (OA)-Bewegung. Mehr dazu unter
http://archiv.twoday.net/stories/2966942/
Die folgenden Ausführungen stützen sich auf Surf-Erfahrungen mit universitären Hochschulschriftenservern vorwiegend in Deutschland. Es wird sowohl die Perspektive des Wissenschaftlers zugrundegelegt, der als potentieller Autor beitragsberechtigt ist, als auch diejenige des Forschers, der die Inhalte nutzen will.
Zunächst die "Pflicht".
* Der Server muss auf der Startseite der Bibliothek prominent verlinkt sein
Nicht selten sucht man vergeblich nach dem Hochschulschriftenserver, obwohl dieser ein zentrales Angebot der Bibliothek darstellt.
* Die Navigation und die Suche nach Dokumenten muss einfach sein
Die meisten deutschen Universitäten nutzen die OPUS-Software. Dies hat den Vorteil für den Nutzer, dass er die bei einem OPUS-Server erlernten Fertigkeiten im Umgang auf die anderen anwenden kann.
DSpace bietet eine Sortierung nach Datum, was durchaus sinnvoll sein kann.
* Neue Dokumente müssen durch RSS-Feeds angezeigt werden
In der Regel ist es sinnvoll, mehrere Feeds anzubieten. Wer sich für geisteswissenschaftliche Texte interessiert, wird mit einem Feed unzufrieden sein, der überwiegend naturwissenschaftliche Dissertationen enthält.
* Es muss eine stabile Internetadresse und eine Zitierempfehlung angegeben werden
URL und URN schön und gut, aber der Student weiss nicht, ob er nun die URL oder die URN (mit Resolver) zitieren soll. Unklar ist auch, ob bei "Diss. Freiburg 2004" sich auf die Abgabe der Arbeit oder die Einstellung auf dem Server bezieht. An sich bietet sich für das Zitat das spätere Datum, also das der Einstellung an, da der Autor z.B. einzelne Nachträge gegenüber der eingereichten Fassung eingebracht haben kann.
* Es sind ausführliche und korrekte Metadaten (einschließlich des jeweiligen Inhaltsverzeichnisses) beizugeben
Es ist darauf zu achten, dass die vom Autor gelieferte Zusammenfassung korrekt ist. Ein extremes Beispiel aus Giessen
http://archiv.twoday.net/stories/2943753/
Bereits gedruckte Beiträge sollten korrekt und vollständig zitiert werden. Liegen Abweichungen gegenüber der Druckfassung vor (z.B. Preprint) sollten dies - ggf. nachträglich - vermerkt werden.
Wird eine Hochschulschrift nachträglich gedruckt, sollte dies ebenfalls bei den Metadaten vermerkt werden.
Mehrbändige oder sonst zusammengehörige Werke müssen durch Querverweise verknüpft werden.
Angesichts der Diskussionen über "Kataloganreicherung" und der guten Erfahrungen aus den USA (Suchbarkeit der TOCs) sollte es selbstverständlich sein, dass bei Monographien den Metadaten das komplette Inhaltsverzeichnis hinzugefügt wird. Auch bei längeren Aufsätzen kann das ratsam sein.
Bei Sammelbänden wie Festschriften empfiehlt es sich, die einzelnen Beiträge als Dokumente einzustellen.
Dass Sammelbände als Gesamt-PDF verfügbar gemacht werden, ohne dass wenigstens in der Eingangsseite das Inhaltsverzeichnis verfügbar ist, ist nicht akzeptabel.
* Die Metadaten sollten auch auf Englisch vorliegen
* Das PDF sollte einen sinnvollen Dateinamen haben.
Wer es sich herunterlädt, sollte den Dateinamen nicht ändern müssen und anhand des Dateinamens einen Hinweis auf den Inhalt bekommen.
http://www.freidok.uni-freiburg.de/volltexte/1493/pdf/diss_korr_endversion.pdf
ist nicht hilfreich. paeslack_fotografie wäre besser.
*Die Inhalte müssen sowohl in Suchmaschinen als auch über OAI-Harvester und Verbundkataloge gut auffindbar sein.
Das Angebot muss suchmaschinenfreundlich gestaltet sein. Dazu gibt es Informationen seitens der Suchmaschinen.
Dazu gehört insbesondere, dass die selten kontraproduktive Belegung des Titelfelds mit "Eingang zum Volltext" o.ä. aufhört. Der title-tag ist für das Suchmaschinen-Ranking zu wichtig, als dass man ihn mit solchem Unsinn vergeuden dürfte.
Die Metadaten müssen für das OAI-Harvesting frei zugänglich sein.
Alle Metadaten der Dokumentenserver müssen auch in den Verbundkatalogen komplett suchbar sein.
* Es muss den Autoren nahegelegt werden, eine Creative-Commons-Lizenz für ihren Beitrag zu vergeben
Empfehlenswert ist die CC-BY-Lizenz, die von führenden OA-Zeitschriften verwendet wird. Leider bevorzugen viele deutsche Wissenschaftler NC-Lizenzen, die die kommerzielle Nutzung ausschließen. Dies steht aber nicht im Einklang mit den Vorgaben der OA-Erklärungen, die einen solchen Nutzungsausschluss nicht vorsehen.
OA heisst nicht nur kostenfrei, sondern auch frei von urheberrechtlichen und lizenzrechtlichen Beschränkungen (permission barriers)!
Der übliche umfassende urheberrechtliche Rechtevorbehalt ist mit OA nicht vereinbar.
* Die Langzeitarchivierung muss sichergestellt sein
Hochschulschriftenserver sollten für alle Dokumente (nicht nur eine Auswahl) die dauernde Verfügbarkeit garantieren. Es geht z.B. nicht an, bei Dissertationen eine Einstellung nur auf 10 Jahre zu vereinbaren:
http://bibliotheksrecht.blog.de/2006/11/14/elektronisches_promovieren_in_halle~1328014
Da es sich vielfach um die einzige elektronische Kopie handelt, die im Netz vorhanden ist, setzt eine wissenschaftliche Verwertung voraus, dass die zitierte Arbeit auch künftigen Forschergenerationen zur Nachprüfung zur Verfügung steht. Dies gilt auch für Working Papers und ähnliche Schriften. Nicht in allen Fällen wird man in der Nationalbibliothek fündig werden.
Ein Rückzug von Texten sollte nicht möglich sein. Wer ein Buch veröffentlicht, kann dieses auch nicht einsammeln.
* Es sollte bei gedruckten Publikationen möglichst beides angeboten werden: Faksimile und E-Text
Das ist bislang noch nicht üblich, aber äußerst sinnvoll. Der Autor steht bei einem älteren Aufsatz, den er auch als E-Text verfügbar hat, nämlich vor einem Dilemma: Soll er das zitierfähige Faksimile scannen oder den E-Text einreichen? Der entscheidende Vorteil des Volltextes geht verloren, wenn nur ein Faksimile bereitgestellt wird.
Falls das Verlags-PDF nicht zur Verfügung steht, sollte man zu einem gescannten Text immer auch einen E-Text beigeben. Das kann sowohl eine Autorfassung sein als auch ein OCR-Text. Sinnvoll ist auch die Verwendung eines zweischichtigen PDFs:
http://archiv.twoday.net/stories/338568/
* Es muss eine komfortable Suche in den Volltexten des Servers möglich sein
Eine Suchmöglichkeit nach Metadaten genügt nicht. Google Custom Search ist bislang nicht ausgereift genug, um eine korrekte übergreifende Suche in Repositorien zu gewährleisten. Eine hauseigene Suchmaschine kann zusätzliche Möglichkeiten (wie Trunkierung) gegenüber Google bieten.
Und nun zur Kür.
Auch Dokumentenserver müssen sich der Herausforderung durch das Web 2.0 stellen.
Sie müssen soziale Bookmark-Dienste wie http://del.ici.us oder http://www.connotea.org/ unterstützen.
Von Benutzer vergebene Tags können zur Sacherschliessung beitragen.
Man könnte auch mit einem Bewertungs-System oder einer Kommentar-Funktion experimentieren.
Bereits heute bieten US-Dokumentenserver die Möglichkeit, einen Kollegen per Mail auf ein Dokument hinzuweisen.
Sinnvoll ist es auch, den Dokumenten Kontaktinformationen zum Autor beizugeben. Dies kann sinnvollerweise durch eine Verknüpfung mit einer Forschungsdatenbank der Hochschule oder mit einer Universitätsbibliographie erfolgen.
Im bibliothekarischen Server E-LIS wird empfohlen, die Liste der Referenzen in die Metadaten zu kopieren. Für Zitat-Analysen ist es natürlich wichtig, dass die in den Dokumenten zitierte Literatur in XML-formatierter Form abrufbar ist. Umgekehrt will man natürlich auch wissen, wer das betreffende Dokument seinerseits zitiert.
Es muss viel mehr Werbung für die Server gemacht werden!
Dies kann etwa in Form eines Weblogs, das z.B. Highlights vorstellt, geschehen.
Oder man könnte virtuelle thematische Sammelbände aus aktuellen und historischen Beiträgen zusammenstellen, wobei man auch Inhalte anderer Server, soweit diese Aufsätze unter freier Lizenz stehen, spiegeln könnte.
Fachreferenten müssen in den Linklisten der Bibliothek auf die Inhalte des Dokumentenservers hinweisen und Sorge dafür tragen, dass besonders attraktive Angebote auch in die fachwissenschaftliche Kommunikation (Mailinglisten, Weblogs, Newsletter, Fachzeitschriften) einfließen.
Auch bei den Wissenschaftlern der Hochschule muss erheblich mehr Werbung betrieben werden. Oft gibt es hochschulweite oder fakultätsbezogene Mailverteiler, die die Hochschulbibliothek nutzen könnte, um Wissenschaftler über OA und die Möglichkeiten der elektronischen Publikation zu unterrichten.
Gezielt sollten wichtige Gelehrte - auch telefonisch - angesprochen werden. Können Beiträge von ihnen eingeworben werden, sollten diese entsprechend herausgestellt werden (zum niederländischen OA-Programm "Cream of Science" siehe http://www.creamofscience.org/ )
Da der Impact-Faktor offenkundig nicht Anreiz genug ist, sollte man auch darüber nachdenken, welche Anreize noch für Wissenschaftler attraktiv sind.
Üblicherweise erfährt man in Newslettern und News-Meldungen mehr über lizenzierte Datenbanken als über den hauseigenen Dokumentenserver. Dieser darf kein Kümmerdasein führen, sondern muss als wichtiger Teil des Hochschul-Wissensschatzes propagiert werden. Bisher hat man zuweilen den Eindruck, dass der hochschuleigene Dokumentenserver nur eine lieblos absolvierte Pflichtübung darstellt, für die es sich nicht lohnt, neue Ideen zu investieren.
http://archiv.twoday.net/stories/2966942/
Die folgenden Ausführungen stützen sich auf Surf-Erfahrungen mit universitären Hochschulschriftenservern vorwiegend in Deutschland. Es wird sowohl die Perspektive des Wissenschaftlers zugrundegelegt, der als potentieller Autor beitragsberechtigt ist, als auch diejenige des Forschers, der die Inhalte nutzen will.
Zunächst die "Pflicht".
* Der Server muss auf der Startseite der Bibliothek prominent verlinkt sein
Nicht selten sucht man vergeblich nach dem Hochschulschriftenserver, obwohl dieser ein zentrales Angebot der Bibliothek darstellt.
* Die Navigation und die Suche nach Dokumenten muss einfach sein
Die meisten deutschen Universitäten nutzen die OPUS-Software. Dies hat den Vorteil für den Nutzer, dass er die bei einem OPUS-Server erlernten Fertigkeiten im Umgang auf die anderen anwenden kann.
DSpace bietet eine Sortierung nach Datum, was durchaus sinnvoll sein kann.
* Neue Dokumente müssen durch RSS-Feeds angezeigt werden
In der Regel ist es sinnvoll, mehrere Feeds anzubieten. Wer sich für geisteswissenschaftliche Texte interessiert, wird mit einem Feed unzufrieden sein, der überwiegend naturwissenschaftliche Dissertationen enthält.
* Es muss eine stabile Internetadresse und eine Zitierempfehlung angegeben werden
URL und URN schön und gut, aber der Student weiss nicht, ob er nun die URL oder die URN (mit Resolver) zitieren soll. Unklar ist auch, ob bei "Diss. Freiburg 2004" sich auf die Abgabe der Arbeit oder die Einstellung auf dem Server bezieht. An sich bietet sich für das Zitat das spätere Datum, also das der Einstellung an, da der Autor z.B. einzelne Nachträge gegenüber der eingereichten Fassung eingebracht haben kann.
* Es sind ausführliche und korrekte Metadaten (einschließlich des jeweiligen Inhaltsverzeichnisses) beizugeben
Es ist darauf zu achten, dass die vom Autor gelieferte Zusammenfassung korrekt ist. Ein extremes Beispiel aus Giessen
http://archiv.twoday.net/stories/2943753/
Bereits gedruckte Beiträge sollten korrekt und vollständig zitiert werden. Liegen Abweichungen gegenüber der Druckfassung vor (z.B. Preprint) sollten dies - ggf. nachträglich - vermerkt werden.
Wird eine Hochschulschrift nachträglich gedruckt, sollte dies ebenfalls bei den Metadaten vermerkt werden.
Mehrbändige oder sonst zusammengehörige Werke müssen durch Querverweise verknüpft werden.
Angesichts der Diskussionen über "Kataloganreicherung" und der guten Erfahrungen aus den USA (Suchbarkeit der TOCs) sollte es selbstverständlich sein, dass bei Monographien den Metadaten das komplette Inhaltsverzeichnis hinzugefügt wird. Auch bei längeren Aufsätzen kann das ratsam sein.
Bei Sammelbänden wie Festschriften empfiehlt es sich, die einzelnen Beiträge als Dokumente einzustellen.
Dass Sammelbände als Gesamt-PDF verfügbar gemacht werden, ohne dass wenigstens in der Eingangsseite das Inhaltsverzeichnis verfügbar ist, ist nicht akzeptabel.
* Die Metadaten sollten auch auf Englisch vorliegen
* Das PDF sollte einen sinnvollen Dateinamen haben.
Wer es sich herunterlädt, sollte den Dateinamen nicht ändern müssen und anhand des Dateinamens einen Hinweis auf den Inhalt bekommen.
http://www.freidok.uni-freiburg.de/volltexte/1493/pdf/diss_korr_endversion.pdf
ist nicht hilfreich. paeslack_fotografie wäre besser.
*Die Inhalte müssen sowohl in Suchmaschinen als auch über OAI-Harvester und Verbundkataloge gut auffindbar sein.
Das Angebot muss suchmaschinenfreundlich gestaltet sein. Dazu gibt es Informationen seitens der Suchmaschinen.
Dazu gehört insbesondere, dass die selten kontraproduktive Belegung des Titelfelds mit "Eingang zum Volltext" o.ä. aufhört. Der title-tag ist für das Suchmaschinen-Ranking zu wichtig, als dass man ihn mit solchem Unsinn vergeuden dürfte.
Die Metadaten müssen für das OAI-Harvesting frei zugänglich sein.
Alle Metadaten der Dokumentenserver müssen auch in den Verbundkatalogen komplett suchbar sein.
* Es muss den Autoren nahegelegt werden, eine Creative-Commons-Lizenz für ihren Beitrag zu vergeben
Empfehlenswert ist die CC-BY-Lizenz, die von führenden OA-Zeitschriften verwendet wird. Leider bevorzugen viele deutsche Wissenschaftler NC-Lizenzen, die die kommerzielle Nutzung ausschließen. Dies steht aber nicht im Einklang mit den Vorgaben der OA-Erklärungen, die einen solchen Nutzungsausschluss nicht vorsehen.
OA heisst nicht nur kostenfrei, sondern auch frei von urheberrechtlichen und lizenzrechtlichen Beschränkungen (permission barriers)!
Der übliche umfassende urheberrechtliche Rechtevorbehalt ist mit OA nicht vereinbar.
* Die Langzeitarchivierung muss sichergestellt sein
Hochschulschriftenserver sollten für alle Dokumente (nicht nur eine Auswahl) die dauernde Verfügbarkeit garantieren. Es geht z.B. nicht an, bei Dissertationen eine Einstellung nur auf 10 Jahre zu vereinbaren:
http://bibliotheksrecht.blog.de/2006/11/14/elektronisches_promovieren_in_halle~1328014
Da es sich vielfach um die einzige elektronische Kopie handelt, die im Netz vorhanden ist, setzt eine wissenschaftliche Verwertung voraus, dass die zitierte Arbeit auch künftigen Forschergenerationen zur Nachprüfung zur Verfügung steht. Dies gilt auch für Working Papers und ähnliche Schriften. Nicht in allen Fällen wird man in der Nationalbibliothek fündig werden.
Ein Rückzug von Texten sollte nicht möglich sein. Wer ein Buch veröffentlicht, kann dieses auch nicht einsammeln.
* Es sollte bei gedruckten Publikationen möglichst beides angeboten werden: Faksimile und E-Text
Das ist bislang noch nicht üblich, aber äußerst sinnvoll. Der Autor steht bei einem älteren Aufsatz, den er auch als E-Text verfügbar hat, nämlich vor einem Dilemma: Soll er das zitierfähige Faksimile scannen oder den E-Text einreichen? Der entscheidende Vorteil des Volltextes geht verloren, wenn nur ein Faksimile bereitgestellt wird.
Falls das Verlags-PDF nicht zur Verfügung steht, sollte man zu einem gescannten Text immer auch einen E-Text beigeben. Das kann sowohl eine Autorfassung sein als auch ein OCR-Text. Sinnvoll ist auch die Verwendung eines zweischichtigen PDFs:
http://archiv.twoday.net/stories/338568/
* Es muss eine komfortable Suche in den Volltexten des Servers möglich sein
Eine Suchmöglichkeit nach Metadaten genügt nicht. Google Custom Search ist bislang nicht ausgereift genug, um eine korrekte übergreifende Suche in Repositorien zu gewährleisten. Eine hauseigene Suchmaschine kann zusätzliche Möglichkeiten (wie Trunkierung) gegenüber Google bieten.
Und nun zur Kür.
Auch Dokumentenserver müssen sich der Herausforderung durch das Web 2.0 stellen.
Sie müssen soziale Bookmark-Dienste wie http://del.ici.us oder http://www.connotea.org/ unterstützen.
Von Benutzer vergebene Tags können zur Sacherschliessung beitragen.
Man könnte auch mit einem Bewertungs-System oder einer Kommentar-Funktion experimentieren.
Bereits heute bieten US-Dokumentenserver die Möglichkeit, einen Kollegen per Mail auf ein Dokument hinzuweisen.
Sinnvoll ist es auch, den Dokumenten Kontaktinformationen zum Autor beizugeben. Dies kann sinnvollerweise durch eine Verknüpfung mit einer Forschungsdatenbank der Hochschule oder mit einer Universitätsbibliographie erfolgen.
Im bibliothekarischen Server E-LIS wird empfohlen, die Liste der Referenzen in die Metadaten zu kopieren. Für Zitat-Analysen ist es natürlich wichtig, dass die in den Dokumenten zitierte Literatur in XML-formatierter Form abrufbar ist. Umgekehrt will man natürlich auch wissen, wer das betreffende Dokument seinerseits zitiert.
Es muss viel mehr Werbung für die Server gemacht werden!
Dies kann etwa in Form eines Weblogs, das z.B. Highlights vorstellt, geschehen.
Oder man könnte virtuelle thematische Sammelbände aus aktuellen und historischen Beiträgen zusammenstellen, wobei man auch Inhalte anderer Server, soweit diese Aufsätze unter freier Lizenz stehen, spiegeln könnte.
Fachreferenten müssen in den Linklisten der Bibliothek auf die Inhalte des Dokumentenservers hinweisen und Sorge dafür tragen, dass besonders attraktive Angebote auch in die fachwissenschaftliche Kommunikation (Mailinglisten, Weblogs, Newsletter, Fachzeitschriften) einfließen.
Auch bei den Wissenschaftlern der Hochschule muss erheblich mehr Werbung betrieben werden. Oft gibt es hochschulweite oder fakultätsbezogene Mailverteiler, die die Hochschulbibliothek nutzen könnte, um Wissenschaftler über OA und die Möglichkeiten der elektronischen Publikation zu unterrichten.
Gezielt sollten wichtige Gelehrte - auch telefonisch - angesprochen werden. Können Beiträge von ihnen eingeworben werden, sollten diese entsprechend herausgestellt werden (zum niederländischen OA-Programm "Cream of Science" siehe http://www.creamofscience.org/ )
Da der Impact-Faktor offenkundig nicht Anreiz genug ist, sollte man auch darüber nachdenken, welche Anreize noch für Wissenschaftler attraktiv sind.
Üblicherweise erfährt man in Newslettern und News-Meldungen mehr über lizenzierte Datenbanken als über den hauseigenen Dokumentenserver. Dieser darf kein Kümmerdasein führen, sondern muss als wichtiger Teil des Hochschul-Wissensschatzes propagiert werden. Bisher hat man zuweilen den Eindruck, dass der hochschuleigene Dokumentenserver nur eine lieblos absolvierte Pflichtübung darstellt, für die es sich nicht lohnt, neue Ideen zu investieren.
KlausGraf - am Dienstag, 21. November 2006, 23:56 - Rubrik: Open Access
lambo meinte am 2006/11/24 19:17:
Bessere Unterstützung des Workflows
Die Entwickler von Dokumentenserver-Software könnten sich um eine bessere Unterstützung des editorischen Workflows bemühen. Damit meine ich nicht nur das Einbringen von Metadaten oder zu überprüfen, ob eine PDF-Datei lesbar ist, obwohl auch das natürlich wichtig ist und durch geeignete Tools unterstützt werden sollte. Darüberhinaus sollte man aber z.B. auch Peer-Review-Prozesse (und damit meine ich sowohl "offenen" als auch traditionellen Review) ins Auge fassen. Wenn man so etwas mit wenigen Mausklicks organisieren könnte, sozusagen in einer Kette, bei der das anerkannte, ggf. noch überarbeitete Dokument dann gleich im digitalen Archiv landet, dann würde das allen helfen: Das Leben von Autoren und Reviewern wäre einfacher, die Bibliothekare könnten ihre Repositories deshalb leichter an den Mann bringen (und natürlich an die Frau), und damit wäre dann letztlich auch dem Anliegen von OA gedient. Man könnte noch weitergehen und Autoren auch dabei unterstützen, standardisierte Wiki-Umgebungen (z.B. Wikimedia-Projekte oder geschlossene MediaWiki-Installationen) als Werkbank zum Bearbeiten ihrer Informationen und zum Schreiben ihrer Texte einzusetzen. Es wäre schön, wenn es einfach wäre, z.B. überarbeitete Wikibooks per Mausklick als "fertige", dann nicht mehr veränderbare PDF-Dokumente auf einen entsprechenden Dokumentenserver auszuchecken. Aber das ist sicherlich Zukunftsmusik.