WDF*IDF bezeichnet eine Formel zur Bestimmung des Verhältnisses zwischen bestimmten Schlagwörtern oder Phrasen und einem Gesamttext. Typischerweise wird sie in der Onpage Optimierung dafür genutzt, um in Suchmaschinen ein besseres Ranking zu erzielen und in den SERPs zu ranken. Dabei spielen unter anderem die Keyword Dichte, Wortanzahl und fremde Texte eine große Rolle.

Definition und Formeln von WDF und IDF

WDF

WDF ist die englische Abkürzung für den Term „Within Document Frequency“ (zu Deutsch: Häufigkeit innerhalb eines Dokuments). Es bezeichnet, wie hoch die Dichte eines Wortes in einem Dokument oder auf einer Webseite ist im Vergleich zu der Relevanz aller anderen Wörter innerhalb des Textes. Es unterscheidet sich von der reinen Keyworddichte insofern, weil die letztere nur den relativen Wert zwischen Wortvorkommen und Gesamtwortanzahl beschreibt (TF (Term frequency)=i/L )

Die Berechnung von WDF erfolgt durch einen Logarithmus, welcher das Keyword in Verhältnis zu den restlichen Termen eines Dokumentes setzt:

WDF*IDF Formel
Formel zur Berechnung von WDF

Die WDF*IDF Formel lässt sich so erklären: i steht für das entsprechende Keyword, j für das Dokument, L für die Gesamtanzahl der Wörter innerhalb des Dokuments und freq(i,j) beschreibt die Häufigkeit des Wortes i im Dokument j. Es ist klar zu erkennen, dass es sich schon beim ersten Teil der WDF*IDF Analyse nicht um eine einfache Keyworddichte handelt. Als Beispiel: In einem Text (j) mit der Gesamtwortanzahl von 15.000 (L) sei ein Keyword 20 mal (i) erwähnt worden. Aus der Rechnung ergibt sich, dass WDF=0,317 ist, während die Keyworddichte um einiges geringer ausfällt, nämlich 0,001. Der Gewichtungswert WDF ist für die Suchmaschinenoptimierung (SEO) wichtig, da dieser eine zu starke Gewichtung eines Keywords darstellen kann.

IDF

Der zweite Teil der WDF*IDF Analyse bezeichnet die inverse Dokumenthäufigkeit und ist die Abkürzung für „Inverse Document Frequency“ (IDF). Dieser stellt den Wert aus der WDF Analyse in Relation zu allen bekannten Texten, welche auch das entsprechende Keyword in sich tragen. In Suchmaschinen bedeutet dies, dass alle indexierten Webseiten mit dem Wort zur Berechnung zugezogen werden. Mit Hilfe von IDF wird also ermittelt, wie relevant ein insgesamt Keyword in Relation zu allen Texten ist. Auch der IDF Wert wird durch einen Logarithmus ermittelt und sieht wie folgt aus:

Formel zur Berechnung von IDF

Werden IDF und WDF miteinander multipliziert, werden die beiden Werte zueinander in Relation gesetzt. Daraus lässt sich erkennen, wie stark die Gewichtung eines Worts (oder einer Phrase) ist im Verhältnis zu allen relevanten Texten und Dokumenten.

Bedeutung für die Suchmaschinenoptimierung (SEO)

Die WDF*IDF Analyse ist heute ein viel genutztes Tool und spielt eine zentrale Rolle für die Optimierung von SEO Texten. Das ist kein Wunder, denn durch die korrekte Anwendung des Werkzeugs kann ein hohes Ranking in den Suchmaschinen erzielt und die Webpräsenz somit verbessert werden. Logischerweise erhöht sich durch ein besseres Ranking weiterhin die CTR. Webmaster können gezielt ihre Seite gestalten und so mehr Besucher anlocken, da sie besser ranken.

WDF*IDF entwickelte sich von der reinen Keyworddichte weiter, da diese weniger genau und aussagekräftig in Bezug auf Wettbewerb und SEO ist. Es ist davon auszugehen, dass sich das Tool auch in Zukunft weiterentwickelt und eine wichtige Rolle spielt, da das Semantic Web immer bedeutender für die SEO wird. Hier werden inhaltliche Zusammenhänge von Google und Co. erstellt, was zur Folge hat, dass auch eine semantische Optimierung stattfinden sollte. Es werden also ähnliche Themen und Inhalte für die Gestaltung einer Webseite oder eines Dokuments immer wichtiger.

Häufig gestellte Fragen

Welche Alternativen gibt es zu WDF*IDF?

Für die Optimierung von Texten und den eingegebenen Keywords können neben der WDF*IDF-Analyse zum Beispiel auch mit BM25, Word2Vec, GloVe, N-Gram-Modellen und LDA (Latent Dirichlet Allocation) perfekte Inhalte erstellt werden.

Was ist der LSI?

LSI steht für Latent Semantic Indexing und ist eine Methode der Informations- und Textverarbeitung. Es nutzt lineare Algebra, um den Text in semantische Themen zu unterteilen und ähnliche Dokumente zu identifizieren, indem es häufig vorkommende Wortgruppen identifiziert. LSI wird häufig in Suchmaschinen und Bibliotheken verwendet, um ähnliche Dokumente auf der Grundlage ihrer semantischen Bedeutung zu finden.

Was ist eine SERP-Analyse?

SERP-Analysen sind hilfreich, um nützliche Informationen und hochwertige Inhalte für den entsprechenden Suchbegriff formal und inhaltlich richtig aufzubereiten. Dazu zählt für den jeweiligen Suchbegriff die Suchintention der User und der Text, der in den Suchergebnissen aktuell auf Platz 1 rankt.

Quellen

 

3.4/5 - (5 votes)