Was wir von Google lernen können

Die ungebremste Kreativität der Web-Suche

W3C

Rigo Wenning

Frankfurter Justitia für IFRI

Merzig/Saar, Germany
26 April 2006

Rigo Wenning (W3C) <rigo@w3.org>

Die Google-Hysterie

Wir alle verfolgen die Hysterie in den Medien, mit denen jeder Schritt von Google verfolgt wird. Jede noch so kleine Neuigkeit wird zu einer Änderung des Web hochstilisiert. Der Wert des Unternehmens zum Tag des Börsengangs spricht Bände. Wie es scheint, trauen die Anleger Google noch mehr zu. Zu der Hysterie passt dann auch die Angst der Konkurrenten. Und das sind Beileibe nicht nur Suchmaschinen-Macher. Google will mehr sein als nur eine Suchmaschine und legt sich mit Riesen wie Microsoft an. Weil bisher jeder Coup geglückt ist, kann man die Angst auch ein wenig verstehen.

Ein explosionsartiges Wachstum

1996 haben wir alle noch brav mit AltaVista gesucht und empfanden diese Suchmaschine als ein beängstigendes Monopol. Von Altavista redet heute keiner mehr. Google hat alle anderen Suchmaschinen in Nischen verdrängt und in den vergangenen 10 Jahren imposant gewachsen. Gleichzeitig hat Google erfolgreich aus der Suchmaschinen-Ecke heraus in alle möglichen Bereiche expandiert und sucht nach immer neuen lukrativen Betätigungsfeldern. Teils kommen eigene Innovationen zum Zuge, teils werden schon etablierte innovative Strömungen aufgenommen und die Konkurrenten durch bessere Technik, Nutzen und Interface ausgestochen. Egal ob durch Neu-Einführung oder als Konkurrent, Google scheint immer eine Nasenlänge voraus zu sein.

Beispiele

Wie machen die das?

Ausloten der Kapazitäten der Browser

Das ewige Problem der Datenbanken

Recall

Die Menge aller einschlägigen Dokumente aus der Gesamtmenge

Precision

Die Menge der einschlägigen Dokumente in der Treffermenge

Ein paar Zahlen zum Web…

Die Menge der Dokumente ist enorm:

Das Web hat laut archive.org etwa 55 Milliarden Dokumente. Diese sind teilweise wieder verschwunden, aber im Archiv noch vorhanden. Monatlich kommen 20 Terabyte, als 20 000 Gigabyte hinzu.

Das sind imposante Zahlen, doch Statistiker behaupten, das seien nur 35% der tatsächlich vorhandenen Dokumente. Einzelne Dokumente wiederum enthalten viele einzelne Ressourcen wie Bilder und Scripte. Viele der Seiten heute sind dynamisch generiert, was das Zählen auch nicht leichter macht.

Im Web kann jedermann auch Autor sein. Jeder kann jederzeit eine Web-site aufmachen und publizieren. Dabei unterliegen die Dokumente keinerlei Qualitätskontrolle. Es ist nicht zu ergründen ob ein Bestand «komplett» ist oder nicht.

Juristischen Datenbanken

Juristische Datenbanken haben oftmals den Anspruch auf Vollständigkeit. Es sollen alle Gesetze enthalten sein. Darüber hinaus gibt es eine Qualitätskontrolle hinsichtlich der eingespeicherten Dokumente. Nur bestimmte Personen können Dokumente hinzufügen.

Hinsichtlich der Urteile oder der Literatur ist bisher kein Datenbankanbieter bekannt, der den Anspruch auf die vollständige Erfassung aller Urteile oder Literatur erhebt.

Aber damit erschöpfen sich schon die Gemeinsamkeiten. Denn die einen wollen die Auswahl der Dokumente dem Nutzer überlassen. Andere speichern nur die wichtigen Dokumente. Ob ein Dokument wichtig ist oder nicht, ist dem Urteil nur für das geübte Auge anzusehen. Es gibt jedenfalls keine Suche in den juristischen Datenbanken, die die Suche nach wichtigen Urteilen erlauben würde.

Es wird deutlich, dass die Datenbanken wesentlich weniger Dokumente anbieten, diese aber theoretisch relevanter sein sollten.

Prima Facie

Wenn die Anzahl der Dokumente in Google um mehrere Potenzen höher ist als in den juristischen Datenbanken und die Menge der irrelevanten Dokumente deutlich höher ist, dann müsste Google schlechtere Suchergebnisse bringen.

Warum also Angst haben?

Google:

Ranking ist das Geheimnis von Google. Die Gewichtung der Treffer ist so, dass auch bei der Eingabe von Allerweltsbegriffen ein sinnvolles Ergebnis ausgegeben wird.

vordergründig Kostenlos

Interface

génie

transparente Integration in die Arbeitsumgebung

wertvolle Dokumente

Das Web als Hebel

Google:

Offen für Partner

Google ist nicht Anbieter

Ausblick

Konsequenz: Immer bessere Informationen via Google

Bedeutung für juristische Datenbanken

Abwehrstrategien

Stärken der Datenbanken

Qualität

Vollständigkeit

Informationsaufbereitung nutzen

Neue Technologien nutzen

Innovation bei der Abrechnung

Innovation fördern

Von Google lernen: Lassen Sie die Mitarbeiter spielen!

Vielen Dank

génie