Google Book Search

Nicht selten sind gescannte Seiten unbrauchbar
Nicht selten sind gescannte Seiten unbrauchbar

Google Book Search (ehemals: Google Print) ist ein Service der Suchmaschine Google mit dem Fernziel, das in Büchern gespeicherte Wissen der Welt vorwiegend durch Retrodigitalisierung für die Volltextsuche verfügbar zu machen.

Inhaltsverzeichnis

Beschreibung

Google Book Search speist sich aus zwei Quellen: Google Print im engeren Sinn, dem – nicht weiter kontroversen – Kooperationsprojekt mit Verlagen, und dem juristisch umstrittenen Google Library, bei dem Bücher großer akademischer Bibliotheken ohne Zustimmung der Rechteinhaber massenweise gescannt werden.

Geschichte

Im Oktober 2004 stellte sich der auf die Buchverlage ausgerichtete Aspekt von Google Print vor (Frankfurter Buchmesse, Pressekonferenz mit den Firmengründern Sergey Brin und Larry Page). Erste Berichte über Google Print gab es im gleichen Monat. Im Dezember 2004 begannen Suchergebnisse aus gescannten Büchern in den Ergebnislisten der englischen Suchoberfläche Google.com zu erscheinen.

Seit April 2005 existiert eine eigene Suche für die Inhalte des Programms.

Im Oktober 2005 präsentierte man zur Frankfurter Buchmesse deutsche und anderssprachige Benutzungsoberflächen.

Am 4. November 2005 wurde die Suchseite, nunmehr versehen mit einer Möglichkeit der Abfrage nach Zeiträumen in der erweiterten Suche, offiziell vorgestellt.

Am 17. November 2005 kündigte Google die Umbenennung des Dienstes in seinem Firmen-Weblog an. [1] Zu diesem Zeitpunkt leiteten Anfragen von print.google.com nach books.google.com um.

Kooperation mit den Verlagen

Google erhält von den Verlagen Bücher oder PDF-Dateien zugesandt. Die Bücher werden gescannt und durch OCR als E-Texte in den Index aufgenommen. Nutzer können jeweils nur vergleichsweise wenige Seiten des einzelnen Buchs einsehen. Nach einigen Seiten können nur (kostenfrei) registrierte Nutzer eine Anzahl weiterer Seiten einsehen. Eine Reihe von Seiten ist von vornherein für den Zugriff gesperrt. Nach Erschöpfung des Tageskontingents können keine weiteren Seiten betrachtet werden. Frei zugänglich sind in der Regel das Inhaltsverzeichnis, nicht selten auch das Register.

Google versucht die Inhalte durch eine Art Kopierschutz (sogenanntes „Digital Rights Management“) zu schützen. Die gefundenen Seiten bauen sich langsam auf und können mit den üblichen Mitteln weder abgespeichert noch ausgedruckt werden. Allerdings kursieren im Netz einfache Anleitungen, diesen Schutz zu umgehen.

Kooperation mit Bibliotheken

Google hat vor, in den nächsten Jahren den kompletten Bestand der Bibliothek der University of Michigan (über 7 Millionen Bände) einzuscannen sowie große Teile der US-Universitätsbibliotheken Harvard und Stanford, der New York Public Library und in Europa der Bodleian Library der Oxford University. Auch die Bibliotheken der Universitäten in Virginia, Wisconsin-Madison, Princeton, Kalifornien sowie in Texas-Austin beteiligen sich.

Heftige Kritik von Autoren- und Verlegerseite hat Google dazu gebracht, das Scannen von urheberrechtlich geschützten Büchern bis November 2005 auszusetzen. Bis zu diesem Zeitpunkt sollten die Rechteinhaber angeben, welche Bücher sie nicht zugänglich gemacht haben möchten (Opt-Out-Lösung). Während Google sich auf den fair use des US-Rechts beruft und dabei von renommierten Juristen unterstützt wird, fordern die Verleger und Autorenverbände, dass kein Buch ohne Zustimmung ins Programm eingestellt wird (Opt-In). Im Oktober 2005 wurden in den USA Klagen von Autoren und Verlegern gegen Google eingereicht.

Ende 2006 traten zwei weitere Institutionen dem Verbund der Bibliotheken bei, die Bücher bei Google digitalisieren lassen: Die Nationalbibliothek von Katalonien, Biblioteca de Catalunya in Barcelona und die Bibliothek der Universidad Complutense Madrid. Reg Carr, Leiter der Bodleian Library, der bis dahin einzigen europäischen Partner-Bibliothek, begrüßte die beiden neuen Teilnehmer begeistert und wies die Einwände gegen das Projekt zurück.

Am 6. März 2007 gab die Bayerische Staatsbibliothek in München bekannt, als erste deutsche Bibliothek mit dem Projekt zu kooperieren. Es sollen nun etwa eine Million urheberrechtsfreier Werke aus den historischen Beständen und aus Spezialsammlungen digitalisiert werden.[2]

Stellungnahmen und Kritik

Im Mai 2006 beantragte die Wissenschaftliche Buchgesellschaft mit Unterstützung des Börsenvereins eine Einstweilige Verfügung gegen Google Book Search [3].

Börsenblatt Online/Die Welt vom 30. Juni 2006: Auch wenn die Wissenschaftliche Buchgesellschaft ihren Antrag auf einstweilige Verfügung gegen Google zurückgezogen hat: Moderatere Interessengruppen wie der Börsenverein wollen klären. Er arbeitet an einem Projekt 'Volltextsuche online', das gleichfalls den weltweiten Zugriff auf digitale Inhalte ermöglichen soll, die Urheberrechte aber ganz den Verlagen lässt. „So wird sich Google Print, das im Sommer 2005 wegen juristischer Querelen für mehrere Monate aussetzte, mutmaßlich auch künftig an mehreren Fronten gleichzeitig wehren. In Frankreich etwa ist seit Anfang Juni ein Verfahren, in dem die Verlagsgruppe La Martinière (Le Seuil, Knesebeck, Abrams) den Kaliforniern gleichfalls zur Last legt, das Urheberrecht durch die Digitalisierung von verlagseigenen Titeln zu unterwandern.“

Inzwischen hat es jedoch wieder Gespräche mit Google gegeben; man hofft, sich bis Ende des Jahres gütlich zu einigen [4].

Durch Googles Riesen-Projekt sind die traditionellen Träger kostenfreier Digitalisierung, vor allem die Bibliotheken, unter Druck geraten. Grundsätzlich begrüßt man die Möglichkeit, riesige Buchbestände kostenfrei im Volltext durchsuchen und gemeinfreie ältere Bücher vollständig lesen zu können.

Der vehementeste Kritiker in Europa ist der Direktor der Französischen Nationalbibliothek, Jean-Noël Jeanneney, der mit Gallica das ambitionierteste freie europäische Digitalisierungsprojekt betreibt. Er befürchtet, dass durch die englischsprachige Ausrichtung des Projekts die europäischen Sprachen ins Hintertreffen geraten könnten und warnt vor der „Google-Arroganz“ und der Dominanz einer Hypermacht.[5] Der Historiker Jeanneney plädiert dafür, dass Europa eine Alternative zum Google-Digitalisierungsprojekt auf die Beine stellt. An Google kritisiert er vor allem die Hegemonie des Englischen und den Kumulationseffekt (bei ihm genannt die „Blickfang-Methode“, üblich ist der Begriff „Ranking“, siehe: PageRank), der dazu führe, dass im Kampf um die Aufmerksamkeit des Lesers eine gewollte Konzentration auf die Listenführer stattfinde. Der stärkere Anbieter wird immer noch stärker auf Kosten des Schwächeren. Dadurch werde Google besonders für die Werbung wichtig. Diesem „kapitalistischen“ Google-Prinzip möchte Jeanneney ein Modell entgegensetzen, bei dem der Staat das Sagen in Dingen des kulturellen Gedächtnisses hat. 19 National- und Universitäts-Bibliotheken in Europa haben den Appell der französischen Nationalbibliothek unterzeichnet, um eine drohende geistige und kulturelle Vorherrschaft der USA zu verhindern.

Kritiker bemängelten an Google Library, dass die Partnerbibliotheken mit Knebelverträgen über den Tisch gezogen wurden. Aus bibliothekarischer Sicht werden die oft miserable OCR-Qualität[6] und die mangelhaften Metadaten bemängelt. Die Suchmaschine behält den gesamten Digitalisierungsprozess als Betriebsgeheimnis in der Hand und schließt die Mitarbeiter der Universitäten systematisch aus; sie haben keinen Zugang zu den Räumen des Scan-Projekts und etwaige Fenster sind abgeklebt.

Europäische Nutzer beschweren sich darüber, dass Google für US-Nutzer alle vor 1923 erschienenen Bücher frei zugänglich macht, bei Nicht-US-Nutzern aber alle Bücher nach 1864 als unfrei behandelt, obwohl darunter sehr viele Bücher sind, die in allen Staaten der Welt Public Domain sein dürften (siehe: Regelschutzfrist). Auch bezeichnet Google reine Reprints gemeinfreier Werke als copyrighted material, was zumindest nach US-Recht eine unbegründete Anmaßung (Copyfraud) darstellen dürfte.

Bücher, die nur US-Bürgern zugänglich sind, können mittels eines in den USA ansässigen Proxyservers trotzdem weltweit eingesehen werden. [7]

Bücher aus der Universitätsbibliothek von Michigan sind außer bei Google auch über den OPAC Mirlyn zugänglich. Dort kann auch der OCR-Text der einzelnen Seiten abgerufen werden.

Weitere Projekte

  • Auch der Konkurrent und möglicher Partner von Google, das Internet-Versandhaus Amazon bietet gescannte Bücher im Volltext an, konzentriert sich jedoch auf aktuell im Handel erhältliche Bücher, und will damit den Verkauf gedruckter Bücher fördern. Mit seiner Suche „Search Inside a Book“ [9] macht Amazon Titelseite, Klappentext, Inhaltsverzeichnis, Register und zwei Seiten vor und hinter einem Suchergebnis verfügbar.
  • Die Suchmaschine A9.com[10], eine Amazon-eigene Suchmaschine, die Microsofts Suchtechnologie mit Amazons „Search Inside the Book“ verknüpft, zeigt auf der Basis eines noch kleinen, englischsprachigen Katalogs, wie sich in eingescannten Büchern, Bildern und Websites übergreifend suchen lässt.
  • In Deutschland gibt es zwei große universitäre Digitalisierungszentren: in Göttingen und in München. Bis zum heutigen Tag (Mai 2006) wurden im Göttinger Digitalisierungszentrum 4.487.815 Seiten in 11.726 Bänden digitalisiert. Rund die Hälfte davon ist frei zugänglich. Das Göttinger Vorzeigeobjekt ist die Digitalisierung der Gutenberg-Bibel.
  • The European Library europäischen Initiative, die den Zugang zu den digitalisierten Werke der Mitgliedsländer verbessern soll.
  • Auch große Verlage wie Random House (Bertelsmann) beginnen ihre Buchbestände zu digitalisieren und für Suchmaschinen auffindbar zu machen. Random House stellte im Februar 2007 Teile seiner Buchbestände (5.000 Titel, weitere sollen folgen) online. [11] Mit Insight ermöglicht das Unternehmen seinen Kunden eine festgelegte Anzahl von Seiten pro Titel zu durchsuchen. [12]

Siehe auch

Belege

  1. Jen Grant: Judging Book Search by its cover. Nov. 2005.
  2. Jens Redmer: The Bavarian State Library becomes largest non-English library partner. Inside Google Book Search (06. März 2007); Zugriff am 11. März 2007
  3. http://www.boersenverein.de/de/69181?rubrik=&dl_id=112071
  4. http://www.zeit.de/news/artikel/2006/10/04/76062.xml
  5. Michael Mönninger: Die Google-Bibliothek. in: Die Zeit. Hamburg 2005,32. ISSN 0044-2070
  6. Malte Herwig: Die entleibte Bibliothek. In Der Spiegel 12/2007, S. 186f.
  7. Beispiel einer via browseatwork.com verlinkbaren Seite
  8. Siehe Demo und Open-Access Text Archive
  9. Amazon „Search Inside a Book“
  10. A9.com
  11. Insight, newly launched digital search & browsing service to offer 5,000-plus Random House, Inc. U. S. titles (PDF), Pressemitteilung, 27. Februar 2007
  12. Insight Web Service, Random House

Literatur

Weblinks

Quelle:
Artikel Google Book Search aus der freien Enzyklopädie Wikipedia mit dieser Versionsgeschichte
Lizenz:
Kategorien:
Empfehlungen


Glossbrenner, Emily; Poremsky, Diane; Glossbrenner, Alfred
12,95 €


Gralla, Preston
18,95 €



Dietl, Erhard; Schone, Christoph
8,95 €



Herausgeber: Search Press
14,95 €



Barbaresi, Nina
2,99 €



Bookmarks
delicious wong linkarena google