Archivalia: Googles stattliche Online-Bibliothek

Googles stattliche Online-Bibliothek

Klaus Graf, Googles stattliche Online-Bibliothek, in: Computergenealogie. Magazin für Familienforschung 21 (2006) H. 1, S. 9-10

Der folgende Text wurde am 30. Januar 2006 der Redaktion übermittelt:

Googles stattliche Online-Bibliothek

Als im Herbst 2004 die Suchmaschine Google ihr gewaltiges Zukunftsprojekt "Google Print" (es wurde inzwischen umbenannt in "Google Book Search", deutsch: "Google Buchsuche") ankündigte, löste dies ein kleines Erdbeben bei Verlagen und Bibliotheken aus. Der ehrgeizige Plan des US-Unternehmens sieht vor, in den nächsten Jahren und Jahrzehnten das gesamte gedruckte Buchwissen der Welt in die Suche einzubeziehen. Wohlgemerkt: Die Volltexte sollen suchbar sein, dagegen soll die Möglichkeit, das Buch als Ganzes zu lesen, jedenfalls bei den urheberrechtlich geschützten Werken wie bisher über die Angebote des Buchhandels (bzw. der Antiquariate) und über die Bibliotheken realisiert werden.

Googles Angebot, erreichbar unter books.google.de, speist sich aus zwei Quellen: dem - nicht kontroversen - "Buch Partner-Programm" und dem umstrittenen Bibliotheksprogramm.

Bei dem "Buch Partner Programm" arbeitet Google mit den Verlagen zusammen. Google digitalisiert die ihm zugesandten Bücher oder nützt die zur Verfügung gestellten PDF-Dateien für eine Präsentation, die derjenigen des US-Buchhändlers Amazon ähnelt. Es werden die bei einer Suche gefundenen Seiten nur in geschützter Form dargestellt (auch wenn im Netz einfache Anleitungen kursieren, wie man das Digital-Rights-Management umgehen und die Seiten trotzdem abspeichern und ausdrucken kann), ein Durchblättern des ganzen Buches wird verhindert. Dazu dient auch eine Pflichtregistrierung, will man mehr als einige wenige Seiten einsehen. Verteilt über das ganze Buch sind viele Seiten prinzipiell gesperrt. Mit einiger Geduld kann man aber über einen längeren Zeitraum doch viel vom Inhalt eines Buchs kennenlernen.

Während das Kooperationsprogramm mit den Verlagen auf Freiwilligkeit setzt, digitalisiert Google im Bibliotheksprogramm ohne Zustimmung der Urheber und Rechteinhaber Bücher, die sich in fünf großen akademischen Bibliotheken befinden. Außer der Oxforder Bodleiana liegen alle in den USA. So soll der gesamte Buchbestand der Bibliothek der University of Michigan (über 7 Mio. Bände) eingescannt werden. Google beruft sich auf das "fair use"-Prinzip des US-Urheberrechts und zeigt von geschützten Büchern aus dem Bibliotheksprogramm, soweit diese nicht als "Public Domain" (urheberrechtsfrei) eingestuft werden, jeweils nur kleine Ausrisse mit den gefundenen Suchbegriffen an. Man kann zwar durch geeignete Suchanfragen die inhaltliche Ausrichtung eines Buchs herausbekommen, aber man kann nicht eine ganze Seite am Stück lesen. Trotzdem haben in den USA bereits Autoren und Verlage Klagen gegen Google wegen Urheberrechtsverletzung eingereicht.

Die Pläne des Suchmaschinen-Giganten haben kommerzielle und nicht-kommerzielle Konkurrenten auf den Plan gerufen. Der "Open Content Alliance" (OCA) gehören neben dem nichtgewerblichen "Internet Archive" von Brewster Kahle, einem Visionär freier Internetinhalte, und zahlreichen nordamerikanischen Bibliotheken auch die großen Google-Rivalen Yahoo und MSN (Microsoft) an. Die OCA will Bücher nur mit Zustimmung der Rechteinhaber digitalisieren und einen sehr viel freieren Umgang mit den Public-Domain-Werken ermöglichen als Google dies tut. Einige englische Bücher sind als Muster unter www.openlibrary.org bereits zu besichtigen. In Europa hat sich der Direktor der französischen Nationalbibliothek Jeanneney an die Spitze eines Anti-Google-Projekts gesetzt, das von den Nationalbibliotheken getragen wird und ebenfalls zehntausende Bücher ins Internet stellen will. Hier soll der Schwerpunkt natürlich auf nicht-englischsprachigen Inhalten liegen, denn Jeanneney wirft Google die Vernachlässigung der europäischen Kultur vor.

Bücher zum Durchblättern

Inzwischen hat Google weit über 15.000 Titel - genaue Zahlen sind geheim - in verschiedenen Sprachen als "Public Domain"-Titel bereitgestellt. Diese können ganz gelesen, die Seiten auch abgespeichert und ausgedruckt werden. Allerdings unterscheidet Google in unerfreulicher Weise zwischen US-Bürgern und Nicht-US-Bürgern. US-Bürger können in der Regel Bücher vor 1923, die in den USA generell urheberrechtsfrei sind, einsehen, wenngleich bei ausländischen Publikationen anscheinend eine weitere Zugangsgrenze bei 1908 verläuft. Deutsche Nutzer müssen leider auf die meisten Bücher nach 1864 verzichten, es sei denn sie verwenden einen US-Proxy (was nicht sonderlich schwierig ist, z.B. www.guardster.com). Dazu gibt es - wie zum ganzen Thema dieses Artikels - weitere Hinweise auf der Seite wiki.netbib.de/coma/GooglePrint.

Die Liste der Mängel von Googles Buchsuche ist lang. Ist bei deutschsprachigen Büchern die automatische Schrifterkennung (OCR), die Google über die eingescannten Bücher laufen lässt, ohnehin nicht die beste, so kann man sie bei in Fraktur gesetzten Bänden schlichtweg vergessen. Ein Beispiel für "Googleprintisch" aus einer Goethe-Ausgabe in Fraktur: "Prometheus. ‘lOad bof bum, incite Stot)tcn, ‘lBie fa … Prometheus. Puno Li incite anne Wimo! — ‘lOad if ibm?" Dass ein Unternehmen wie Google sich die inzwischen akzeptable Ergebnisse bei Fraktur liefernde Software von ABBY FineReader nicht leisten wollte, befremdet. Der Anspruch einer Volltextsuche wird bei den vielen Büchern des 19. Jahrhunderts in Fraktur aufgegeben. Und natürlich gibt es unzählige Seiten, die gar nicht oder unlesbar gescannt wurden.

Besonders ärgerlich sind die unzulänglichen Meta-Daten der Bücher. Vor allem bei mehrbändigen Werken, die nicht selten unvollständig sind, und bei Zeitschriftenjahrgängen kann man mit den Google-Angaben, um was es sich handelt, oft nichts anfangen. Wenn man einen interessanten Treffer gefunden hat, der sich in einer von Google als urheberrechtlich geschützt betrachteten Zeitschrift befindet und man erhält nur eine irreführende Jahrgangsangabe von Google (nämlich das Erscheinungsjahr des ersten oder eines anderen Bandes) ist man so klug als wie zuvor. Beispielsweise sind etliche Jahrgänge der "ZHG" digitalisiert worden, aber Google gibt jeweils nur an: "Zeitschrift by Verein für Hessische Geschichte und Landeskunde". Da hilft auch die kleine Abbildung des Titelblatts, auf dem der Jahrgang steht, nicht weiter, denn diese lässt sich nicht vergrößern. Bei der Suche nach "hessische Zeitschrift" sehen deutsche Benutzer einige Bände, von denen scheinbar noch keine Seiten verfügbar sind. Anders verhält es sich, wenn man etwa mit www.guardster.com so tut, als befinde man sich in den USA. US-Bürger haben nicht nur in diesem Fall bessere Zugriffsmöglichkeiten auf die alten Bände aus dem 19. Jahrhundert (die natürlich auch in Europa keinem Urheberrechtsschutz mehr unterliegen, da alle Autoren länger als 70 Jahre tot sind).

Weitere Defizite: Bücher, die bereits zugänglich waren, verschwinden wieder aus dem Index (Beispiel: Kneschkes Adels-Lexikon), und die "erweiterte Suche", die eine Eingrenzung mit date (Beispiel: date:1600-1864) und damit indirekt die Suche nach urheberrechtsfreien Inhalten ermöglicht, arbeitet nur fehlerhaft.

Wer möglichst viel von den Inhalten der Google-Buchsuche profitieren möchte, sollte möglichst viel mit ihr experimentieren. Hilfestellung leistet die genannte Seite auf wiki.netbib.de.

Bereits beachtliche Inhalte

Bei allem Verdruss darf man aber nicht übersehen, dass es sich nach wie vor um eine "vorläufige Version" handelt, die zwar noch viele Kinderkrankheiten aufweist, aber bereits teilweise großartige Inhalte. Hingewiesen sei auf landesgeschichtlich relevante Darstellungen und Quellenausgaben. Da sind etwa die vielen Bände von Riedels "Codex diplomaticus Brandenburgensis", der in manchen Bibliotheken mit striktem Kopierverbot belegt ist. Oder - um ein Werk aus einer anderen Region zu nehmen - die zwei seltenen Bände von Preschers Geschichte der Reichsgrafschaft Limpurg (bei Schwäbisch Hall) von 1789/90. Drei württembergische Oberamtsbeschreibungen können mit einem US-Proxy eingesehen werden. Jeder ist aufgerufen, die für ihn interessanten Bände in Googles Buchsuche zu entdecken, es kommen ja ständig neue hinzu. Und sie mit anderen zu teilen: Was die freien Bücher in Google angeht, sollte man virtuelle Gemeinschaften gründen, die Listen mit besseren Angaben zu den Büchern pflegen und solche freien Bücher herunterladen und dann für die bequeme Offline-Nutzung bereithalten, etwa als gezippte Datei oder als PDF.

Die Zahl der online frei verfügbaren Bücher wird in den nächsten Jahren dramatisch zunehmen - dank Google und seinen Konkurrenten. Soweit es sich um Volltextangebote handelt, wird dies, soviel steht bei aller möglichen Skepsis gegenüber Online-Bibliotheken bereits jetzt fest, auch die familiengeschichtlichen Recherchemöglichkeiten in erheblichem Umfang verbessern.

Illustration:
Screenshot von
http://books.google.com/books?ie=UTF-8&hl=en&id=zMl8ftz0voEC&pg=PP10

KlausGraf - am Samstag, 13. Mai 2006, 21:06 - Rubrik: Open Access

Kommentar verfassen

htmlwolf meinte am 2006/05/15 11:32:

Vielen Dank - und ein Hinweis

Vielen Dank, dass du diesen interessanten Artikel frei zur Verfügung stellst. Ein kleiner Hinweis - am Ende des vierten Absatzes fehlt etwas: ... (auch wenn im Netz einfache
(hinter "einfache" geht es nicht weiter)

Sebastian Wolf

KlausGraf antwortete am 2006/05/15 14:54:

Ups

Da ist der fehlende Textteil an den Anfang gerutscht, keine Ahnung wieso :-(

biopilz meinte am 2007/03/09 14:28:

p2p-netzwerke...

...gibts ja auch noch... und die wachsen schneller als meine pilze *zwinker* (siehe zb http://isohunt.com/torrents/?ihs1=&iho1=&iht=9 )