PageRank
Mit PageRank bezeichnet man ein Verfahren, mit dem man Dokumente, die aufeinander verweisen, nach der Stärke der Verweise innerhalb der Struktur ordnen kann. Dieses Verfahren war der ursprüngliche Hauptansatz des Google Algorithmus, er wurde von Larry Page und Sergei Brin 1996 an der Stanford University entwickelt. Heute ist der PageRank nur ein Bestandteil der verschiedenen Rankingfaktoren von Google.
Inhaltsverzeichnis
Das Prinzip des PageRank
Die grundsätzliche Idee hinter dem PageRank ist, dass Seiten, die von Usern besonders häufig verlinkt werden, interessanter oder hochwertiger sind als Seiten, auf die wenige Links eingehen. Die Menge der eingehenden Links wird zu einem Messwert für die Qualität der Seite, der rekursiv erzeugt wird. Darauf aufbauend werden Links von einer Seite, die selbst häufig verlinkt wird, stärker bewertet, als Links einer Seite mit wenig eingehenden Links.
Der PageRank wird auf einer Skala von 1-10 ausgegeben. Intern wird dieser Wert von Google jedoch präziser berechnet. Google hat nie die präzise Methode, nach dem der öffentliche PageRank berechnet wird, bekannt gegeben. Je höher der PageRank desto größer ist auch das zugewiesene Crawl Budget für die jeweilige Seite (Domain).
Random Surfer Modell
Das Random Surfer Modell ist ein alternativer Ansatz für den PageRank. In diesem wird der PageRank zu der Wahrscheinlichkeit, mit der ein zufälliger Surfer, der auf einer zufälligen Seite beginnt und sich wahllos von Seite zu Seite klickt, auf dieser spezifischen Seite landet. Durch einen Dämpfungsfaktor wird dem Umstand Rechnung getragen, dass ein Surfer nicht unbegrenzt lang weiterklicken wird. Irgendwann wird er aufhören zu surfen oder eine zufällige Seite über die Browserleiste starten. Auch dieser Ansatz wurde von Google mit in die Berechnung des PageRank integriert.
Rational Surfer Modell
Das Rational Surfer Modell ist eine Erweiterung zum Random Surfer Modell. In diesem haben Links auf einer Website nicht die gleiche Wahrscheinlichkeit geklickt zu werden, sondern sie werden nach einer empirisch erhobenen Wahrscheinlichkeit gewichtet. Dadurch haben beispielsweise Links innerhalb der Footer Zeile deutlich weniger Gewicht, als Links die im Content der Seite untergebracht werden.
Vererbung des PageRank
Ein ausgehender Link vererbt seinen PageRank an die verlinkten Seiten weiter. Allerdings nimmt der vererbte PageRank dabei mit einer zunehmenden Anzahl von Verlinkungen ab. Der Grund hierfür kann im Random Surfer Modell begründet werden, da mit zunehmender Anzahl von Links auf einer Seite die Wahrscheinlichkeit für jeden einzelnen sinkt, dass dieser angeklickt wird. Zu beachten ist, dass dieses Prinzip nicht nur bei Links auf externe Seiten gilt, sondern auch Webseiten Intern angewendet wird (vergleiche Link Juice / Link Sculpting).
Probleme des Pagerank
In seiner Ausgangsform war der PageRank ein vergleichsweise leicht zu manipulierendes Mittel. Durch Aufbau von vielen Webseiten ohne Inhalt, die auf andere eigens dafür angelegte Seiten verweisen (sogenannte Linkfarmen), konnten Seiten aufgebaut werden, die einen starken PageRank an kommerziell nutzbare Seiten vererbten. Dafür konnten vollautomatisierte Skripte genutzt werden, so dass mit wenig Aufwand eine starke Platzierung innerhalb der Google Ergebnisse möglich war.
Andere Skripte setzen automatisch Links in Gästebüchern, Foren oder Blogkommentaren. Diese manipulieren zum einen die PR Werte, zum anderen machen sie von Websitenbetreibern Maßnahmen zur Beseitigung bzw. Verhinderung von Spam Links nötig. Zur Bekämpfung von Link Spam führte Google 2005 das „nofollow“ Attribut ein. Ein mit diesem Attribut gekennzeichneter Link vererbt keinen Linkjuice bzw. PageRank an das Ziel der Seite weiter. Webseiten setzen Links in Bereichen von Seiten, die von Usern kommentierbar sind automatisiert mit Hilfe von Content-Management-Systemen auf den Nofollow Status, um Spammer davon abzuhalten Links zu setzen.
Auch Linknetzwerke, bei denen Seiten aufeinander verweisen, nur mit dem Ziel den PageRank der Seiten zu erhöhen, werden von Google als Manipulation betrachtet und durch Penalty Maßnahmen abgestraft.
Ein weiteres Mittel zum Missbrauch steht der Verkauf von Links, vor allem auf Seiten mit hohem PageRank dar. Dadurch, dass der PageRank in der Vergangenheit öffentlich einsehbar war, wurden Links von Seiten mit hohem PR Wert zu einem Handelsgut. Dadurch wird das hohe Gewicht, das diesen Seiten zugesprochen wird, missbraucht. Das Ende der öffentlichen Aktualisierung des PageRanks kann als Gegenmaßnahme hierfür betrachtet werden.
Derzeitige Situation des PageRank
In der Vergangenheit wurde der PageRank von Google regelmäßig veröffentlicht und konnte über Tools von Google selbst eingesehen werden. Dies ist mittlerweile nicht mehr der Fall. Die letzte öffentliche Aktualisierung des PageRanks durch Google fand am am 6. Dezember 2013 statt. Es wird zwar davon ausgegangen, dass Google weiterhin einen internen PageRank verwendet, jedoch im Gegensatz zu den Anfangszeiten ist der PageRank aber nicht mehr der Hauptbestandteil des Google Algorithmus. Wie stark der PageRank in seiner derzeitigen Form Einfluss auf das Ranking in Google einnimmt lässt sich nur mutmaßen, allerdings korrelieren Seiten, die viele eingehende Links aufweisen, nach wie vor gut mit bei Google stark rankenden Seiten.
Häufige Fragen
Was ist der PageRank?
Google verfügt über einen Algorithmus, der die Verlinkungsstruktur einer Website analysiert und diese nach ihrem Gewicht bei den Suchergebnissen anordnet.
Wie funktioniert der PageRank?
Der PageRank legt die Linkpopularität einer Website oder eines Dokuments fest. Je höher das Gewicht (die Qualität und Quantität) der Links, desto größer die Wirkung.
Welche Faktoren spielen für das Google-Ranking noch eine wichtige Rolle?
Neben internen und externen Links gehören die Ladegeschwindigkeit der Seite, die User Experience, der Content, die Ladegeschwindigkeit usw. zu den wichtigsten Rankingfaktoren.
Quellen