Freitag, Januar 20, 2006

Das Google PageRank Verfahren

Vor kurzem habe ich aufgezeigt, wie Google Suchresultate sammelt und priorisiert. Da neben der hohen Performance und einer grossen Benutzerfreundlichkeit ein ganz massgeblicher Teil des Erfolges von Google von der (anderen Suchmaschinen teilweise weit überlegenen) Qualität der Suchergebnisse abhängt, möchte ich hier darauf etwas detaillierter eingehen.

Diese Qualität der Suchergebnisse beruhte vor allem in den Anfangszeiten von Google ganz wesentlich auf dem PageRank-Verfahren. PageRank ermittelt zur Bestimmung der Platzierung (Ranking) die Zahl und die Qualität der eingehenden Links. Der PageRank hängt also davon ab, ob viele eingehende Links von relevanten und angesehenen Websites vorhanden sind.

Meine Betrachtung von PageRank stützt sich auf die Veröffentlichung der Google-Gründer Larry Page und Sergey Brin (sowie Rajeev Motwani und Terry Winograd) welche im Januar 1998 an der Stanford University publiziert wurde, also im Jahr der Gründung von Google Inc.

Doch wie ermittelt Google eigentlich heute, ob eine Website glaubwürdig ist? Nun, eine typische Google Antwort wäre: Google verwendet mehr als 100 unterschiedliche Faktoren, einschließlich des PageRank Algorithmus, um festzustellen ob eine Website vertrauenswürdig oder etabliert ist.

Es ist offensichtlich, dass Google im Verlauf der letzten Jahre mit grosser Wahrscheinlichkeit zahlreiche Änderungen, Anpassungen und Modifikationen am ursprünglichen PageRank-Algorithmus durchgeführt hat. Doch war das PageRank-Verfahren ein wichtiger Faktor für den Erfolg der Suchmaschine Google, womit zumindest das Konzept des PageRank-Verfahrens immer noch seine Berechtigung hat.

Wenn wir uns das Internet als eine Demokratie vorstellen, dann stimmt eine Webseite, die über einen Link auf eine andere Webseite verfügt, über die Wichtigkeit dieser Seite ab. Wie Google im Technologie-Überblick erklärt, interpretiert PageRank einen Link von Seite A und von Seite B zu Seite C als je eine Stimme für Seite C von den Seiten A und B.

PageRank nimmt eine objektive Bewertung der Wichtigkeit von Webseiten vor. Anstatt die direkten Links zu zählen, interpretiert Page Rank im Wesentlichen einen Link von Seite A auf Seite B als "Votum" von Seite A für Seite B. [...]

PageRank bewertet dann die Wichtigkeit einer Seite nach den erzielten Voten. PageRank berücksichtigt auch die Wichtigkeit jeder Seite, die ein Votum abgibt, da Voten von einigen Seiten einen höheren Wert aufweisen und deshalb auch der Seite, auf die der Link verweist, einen höheren Wert geben.

Wenn eine Seite einen Wert von 100 hat und auf zwei Seiten verweist, so erhält jede dieser Seiten ein Votum vom Wert 50. Eine andere Seite mit einem Wert von 9, die auf drei Seiten verweist, gibt jeder dieser Seiten ein Votum vom Wert 3.

Geschichtlicher Abriss der ersten Jahre von Google

Sieben Jahre nach der Gründung verkündet Google Inc. für das Qartal bis 30. September 2005 einen Umsatz von 1,578 Milliarden Dollar und ist mit einem Markenwert von 8,461 Mrd. Dollar von Null auf Platz 38 der weltweit wertvollsten Marken.

  • 1995 - Larry Page und Sergey Brin begegnen sich an der Stanford University. Sie konzipieren die Suchmaschine BackRub ? einen Google-Vorläufer.
  • 21. Januar 1998 - Larry Page und Sergey Brin publizieren den PageRank Algorithmus
  • 1998 - Internetportale äußern Desinteresse an der entwickelten Suchtechnologie - die Gerätschaften befinden sich im Schlafzimmer von Larry Page.
  • 7. September 1998 - In einer Garage gründen Page und Brin die Google Inc. Mit einem Startkapital von umgerechnet 810.000 Euro (aufgebracht von den Familien, Freunden und Andreas von Bechtolsheim) bringen sie die erste Testversion des Programms auf den Markt.
  • Februar 1999 - Google bezieht mit acht Angestellten ein Büro in Palo Alto. Etwa 500.000 Suchanfragen werden täglich verzeichnet.
  • September 1999 - AOL und Netscape arbeiten mit Google zusammen, die Suchanfragen versechsfachen sich.
  • 21. September 1999 - Google beendet offiziell seine Testphase und entfernt den ?beta? Hinweis von der Webseite
  • Juni 2000 - Mit mehr als einer Milliarde Seiten im Index ist Google Marktführer bei Suchmaschinen geworden.

Einen ausführlichen Überblick des PageRank Verfahrens bietet e-factory.de an. Das ursprüngliche Paper (PDF) der Google-Gründer ist bei der Standford University abrufbar.

Tags: Google, PageRank

Keine Kommentare: