PageRank

Mit PageRank bezeichnet man ein Verfahren, mit dem man Dokumente, die aufeinander verweisen, nach der Stärke der Verweise innerhalb der Struktur ordnen kann. Dieses Verfahren war der ursprüngliche Hauptansatz des Google Algorithmus, er wurde von Larry Page und Sergei Brin 1996 an der Stanford University entwickelt. Heute ist der PageRank nur ein Bestandteil der verschiedenen Rankingfaktoren von Google.

Das Prinzip des PageRank

Die grundsätzliche Idee hinter dem PageRank ist, dass Seiten, die von Usern besonders häufig verlinkt werden, interessanter oder hochwertiger sind als Seiten, auf die wenige Links eingehen. Die Menge der eingehenden Links wird zu einem Messwert für die Qualität der Seite, der rekursiv erzeugt wird. Darauf aufbauend werden Links von einer Seite, die selbst häufig verlinkt wird, stärker bewertet, als Links einer Seite mit wenig eingehenden Links.

Der PageRank wird auf einer Skala von von 1-10 ausgegeben. Intern wird dieser Wert von Google jedoch präziser berechnet. Google hat nie die präzise Methode, nach dem der öffentliche PageRank berechnet wird, bekannt gegeben. Je höher der PageRank desto größer ist auch das zugewiese Crawl Budget für die jeweilige Seite (Domain).

Schematische Darstellung des PageRank Verfahrens
Schematische Darstellung der Vererbung des Pagerank. Seiten mit höherem PageRank vererben mehr PageRank als Seiten mit geringem eigenen PageRank. Es ist also sowohl Quantität der Links, als auch deren Stärke relevant.

Random Surfer Modell

Das Random Surfer Modell ist ein alternativer Ansatz für den PageRank. In diesem wird der PageRank zu der Wahrscheinlichkeit, mit der ein zufälliger Surfer, der auf einer zufälligen Seite beginnt und sich wahllos von Seite zu Seite klickt, auf dieser spezifischen Seite landet. Durch einen Dämpfungsfaktor wird dem Umstand Rechnung getragen, dass ein Surfer nicht unbegrenzt lang weiterklicken wird. Irgendwann wird er aufhören zu surfen oder eine zufällige Seite über die Browserleiste starten. Auch dieser Ansatz wurde von Google mit in die Berechnung des PageRank integriert.

Rational Surfer Modell

Das Rational Surfer Modell ist eine Erweiterung zum Random Surfer Modell. In diesem haben Links auf einer Website nicht die gleiche Wahrscheinlichkeit geklickt zu werden, sondern sie werden nach einer empirisch erhobenen Wahrscheinlichkeit gewichtet. Dadurch haben beispielsweise Links innerhalb der Footer Zeile deutlich weniger Gewicht, als Links die im Content der Seite untergebracht werden.

Vererbung des PageRank

Ein ausgehender Link vererbt seinen PageRank an die verlinkten Seiten weiter. Allerdings nimmt der vererbte PageRank dabei mit einer zunehmenden Anzahl von Verlinkungen ab. Der Grund hierfür kann im Random Surfer Modell begründet werden, da mit zunehmender Anzahl von Links auf einer Seite die Wahrscheinlichkeit für jeden einzelnen sinkt, dass dieser angeklickt wird. Zu beachten ist, dass dieses Prinzip nicht nur bei Links auf externe Seiten gilt, sondern auch Webseiten Intern angewendet wird (vergleiche Link Juice / Link Sculpting).

Probleme des Pagerank

In seiner Ausgangsform war der PageRank ein vergleichsweise leicht zu manipulierendes Mittel. Durch Aufbau von vielen Webseiten ohne Inhalt, die auf andere eigens dafür angelegte Seiten verweisen (sogenannte Linkfarmen), konnten Seiten aufgebaut werden, die einen starken PageRank an kommerziell nutzbare Seiten vererbten. Dafür konnten vollautomatisierte Skripte genutzt werden, so dass mit wenig Aufwand eine starke Platzierung innerhalb der Google Ergebnisse möglich war.

Andere Skripte setzen automatisch Links in Gästebüchern, Foren oder Blogkommentaren. Diese manipulieren zum einen die PR Werte, zum anderen machen sie von Websitenbetreibern Maßnahmen zur Beseitigung bzw. Verhinderung von Spam Links nötig. Zur Bekämpfung von Link Spam führte Google 2005 das „nofollow“ Attribut ein. Ein mit diesem Attribut gekennzeichneter Link vererbt keinen Linkjuice bzw. PageRank an das Ziel der Seite weiter. Webseiten setzen Links in Bereichen von Seiten, die von Usern kommentierbar sind automatisiert mit Hilfe von Content Management Systemen auf den Nofollow Status, um Spammer davon abzuhalten Links zu setzen.

Auch Linknetzwerke, bei denen Seiten aufeinander verweisen, nur mit dem Ziel den PageRank der Seiten zu erhöhen, werden von Google als Manipulation betrachtet und durch Penalty Maßnahmen abgestraft.

Ein weiteres Mittel zum Missbrauch steht der Verkauf von Links, vor allem auf Seiten mit hohem PageRank dar. Dadurch, dass der PageRank in der Vergangenheit öffentlich einsehbar war, wurden Links von Seiten mit hohem PR Wert zu einem Handelsgut. Dadurch wird das hohe Gewicht, das diesen Seiten zugesprochen wird, missbraucht. Das Ende der öffentlichen Aktualisierung des PageRanks kann als Gegenmaßnahme hierfür betrachtet werden.

Derzeitige Situation des PageRank

In der Vergangenheit wurde der PageRank von Google regelmäßig veröffentlicht und konnte über Tools von Google selbst eingesehen werden. Dies ist mittlerweile nicht mehr der Fall. Die letzte öffentliche Aktualisierung des PageRanks durch Google fand am am 6. Dezember 2013 statt. Es wird zwar davon ausgegangen, dass Google weiterhin einen internen PageRank verwendet, jedoch im Gegensatz zu den Anfangszeiten ist der PageRank aber nicht mehr der Hauptbestandteil des Google Algorithmus. Wie stark der PageRank in seiner derzeitigen Form Einfluss auf das Ranking in Google einnimmt lässt sich nur mutmaßen, allerdings korrelieren Seiten, die viele eingehende Links aufweisen, nach wie vor gut mit bei Google stark rankenden Seiten.

Quellen

 

Ihr Weg zu mehr Besuchern und Umsatz