Nach freundlicher Hilfe in Wikisource konnte ich endlich wieder einen Blick auf die Microsoft Live Search Books werfen:
http://search.live.com/results.aspx?q=&scope=books&mkt=en-US
Entscheidend ist die URL-Ergänzung mkt=en-US. Ohne diese sieht man nämlich grundsätzlich überhaupt nichts von den Inhalten.
Einige Notizen:
* Es sind kaum deutschsprachige Bücher enthalten.
* Ein Verlinken von einzelnen Büchern und Seiten ist nicht oder wenigstens nicht mit akzeptabel kurzer Internetadresse möglich.
* Es gibt keine erweiterte Suche, also auch keine gezielte Suche nach Metadaten wie bei Google Book Search.
* Während Google Book Search das Problem des Zusammenhaltens mehrbändiger Werke und von Zeitschriftenserien erkannt hat und sich um Besserung bemüht, wird dieses gravierende Problem von MSN ignoriert.
* In Kooperation mit der OCA digitalisierte Bücher sind via Internetarchiv als Ganzes downzuloaden. Das gilt nicht für Public-Domain-Werke z.B. aus der Cornell Library, die einen Copyfraud-Vermerk (wie soll man bitteschön drucken, wenn man an die Seiten gar nicht herankommt?) tragen und bei denen sogar die einzelnen Seiten mit DRM gesichert sind (man kann sie abspeichern, wenn man die Medienliste in den FF-Einstellungen durchgeht). Beispiel: erster Treffer bei Suche nach Felix Fabri oder "The Library of the Palestine Pilgrims' Text Society".
* Die Downloadgröße der Datei im Internetarchiv wird nicht angegeben.
* Es gibt keinen Zugriff auf den OCR-Text via MSN (allenfalls über das Internetarchiv).
* Die OCR hat Probleme mit deutschen Umlauten (statt Gmünd sollte man also Gmund suchen und Gmuend). Ob überhaupt Bände in Fraktur vorhanden sind, weiss ich nicht, bezweifle es aber.
* Eine hundertprozentige Zuverlässigkeit der Volltextsuche in einem Buch liegt auch bei Antiquaschriften nicht vor. So erscheint der begriff gamundia in "A Descriptive Catalogue of Early Prints" auch auf Seite 302.
* Ist die Schrift der Vorlage zu klein, kann man sie nicht lesen, da es keine Vergrößerungsmöglichkeit gibt. Hier muss man dann auf das Internetarchiv ausweichen (sofern dort das Buch vorhanden ist).
* Pluspunkt: Es gibt keine Grenze bei 1864 wie bei GBS für Nicht-US-Bürger. Was vor 1923 liegt, ist anscheinend frei zugänglich.
* Die Metadaten sind noch unzureichender als inzwischen bei GBS.
* Nur die Metadaten der beim Internetarchiv eingestellten Bücher sind via OAIster recherchierbar.
* Während Resultate der Buchsuche bei Google allmählich auch in die Ergebnisse der Websuche integriert werden, ist das bei MSN wohl noch nicht der Fall.
* GBS hat viel mehr Features, einschließlich Web 2.0-Angeboten (Reviews usw.).
* Gerade weil viel wissenschaftlich wichtiger Content (z.B. Jahrgänge der Modern Language Notes) in MSN enthalten ist, ist es bedauerlich, dass Wissenschaftler so gut wie nichts von dem Angebot wissen (in der Regel ist die Hürde mit den Einstellungen bzw. obiger Ergänzung der URL zu hoch.)
* Die Scanqualität scheint höher als bei den (frühen) GBS-Digitalisaten, inzwischen ist auch bei GBS die Qualität besser.
* GBS hat ein dezenteres Wasserzeichen.
FAZIT: GBS hat fast überall die Nase vorn. MSN hat noch zu viele (vermeidbare) Macken, sollte aber ergänzend bei allen Fragestellungen, die in englischsprachiger Literatur behandelt werden, trotzdem herangezogen werden.
Nachtrag: Einzig bekannte Verfeinerungsmöglichkeit der Suche
intitle:
http://search.live.com/results.aspx?q=&scope=books&mkt=en-US
Entscheidend ist die URL-Ergänzung mkt=en-US. Ohne diese sieht man nämlich grundsätzlich überhaupt nichts von den Inhalten.
Einige Notizen:
* Es sind kaum deutschsprachige Bücher enthalten.
* Ein Verlinken von einzelnen Büchern und Seiten ist nicht oder wenigstens nicht mit akzeptabel kurzer Internetadresse möglich.
* Es gibt keine erweiterte Suche, also auch keine gezielte Suche nach Metadaten wie bei Google Book Search.
* Während Google Book Search das Problem des Zusammenhaltens mehrbändiger Werke und von Zeitschriftenserien erkannt hat und sich um Besserung bemüht, wird dieses gravierende Problem von MSN ignoriert.
* In Kooperation mit der OCA digitalisierte Bücher sind via Internetarchiv als Ganzes downzuloaden. Das gilt nicht für Public-Domain-Werke z.B. aus der Cornell Library, die einen Copyfraud-Vermerk (wie soll man bitteschön drucken, wenn man an die Seiten gar nicht herankommt?) tragen und bei denen sogar die einzelnen Seiten mit DRM gesichert sind (man kann sie abspeichern, wenn man die Medienliste in den FF-Einstellungen durchgeht). Beispiel: erster Treffer bei Suche nach Felix Fabri oder "The Library of the Palestine Pilgrims' Text Society".
* Die Downloadgröße der Datei im Internetarchiv wird nicht angegeben.
* Es gibt keinen Zugriff auf den OCR-Text via MSN (allenfalls über das Internetarchiv).
* Die OCR hat Probleme mit deutschen Umlauten (statt Gmünd sollte man also Gmund suchen und Gmuend). Ob überhaupt Bände in Fraktur vorhanden sind, weiss ich nicht, bezweifle es aber.
* Eine hundertprozentige Zuverlässigkeit der Volltextsuche in einem Buch liegt auch bei Antiquaschriften nicht vor. So erscheint der begriff gamundia in "A Descriptive Catalogue of Early Prints" auch auf Seite 302.
* Ist die Schrift der Vorlage zu klein, kann man sie nicht lesen, da es keine Vergrößerungsmöglichkeit gibt. Hier muss man dann auf das Internetarchiv ausweichen (sofern dort das Buch vorhanden ist).
* Pluspunkt: Es gibt keine Grenze bei 1864 wie bei GBS für Nicht-US-Bürger. Was vor 1923 liegt, ist anscheinend frei zugänglich.
* Die Metadaten sind noch unzureichender als inzwischen bei GBS.
* Nur die Metadaten der beim Internetarchiv eingestellten Bücher sind via OAIster recherchierbar.
* Während Resultate der Buchsuche bei Google allmählich auch in die Ergebnisse der Websuche integriert werden, ist das bei MSN wohl noch nicht der Fall.
* GBS hat viel mehr Features, einschließlich Web 2.0-Angeboten (Reviews usw.).
* Gerade weil viel wissenschaftlich wichtiger Content (z.B. Jahrgänge der Modern Language Notes) in MSN enthalten ist, ist es bedauerlich, dass Wissenschaftler so gut wie nichts von dem Angebot wissen (in der Regel ist die Hürde mit den Einstellungen bzw. obiger Ergänzung der URL zu hoch.)
* Die Scanqualität scheint höher als bei den (frühen) GBS-Digitalisaten, inzwischen ist auch bei GBS die Qualität besser.
* GBS hat ein dezenteres Wasserzeichen.
FAZIT: GBS hat fast überall die Nase vorn. MSN hat noch zu viele (vermeidbare) Macken, sollte aber ergänzend bei allen Fragestellungen, die in englischsprachiger Literatur behandelt werden, trotzdem herangezogen werden.
Nachtrag: Einzig bekannte Verfeinerungsmöglichkeit der Suche
intitle:
KlausGraf - am Sonntag, 4. November 2007, 18:50 - Rubrik: Digitale Bibliotheken