So vermeiden Sie Duplicate Content

Duplicate Content einfach verhindern

Doppelte Inhalte sind sowohl für Suchmaschinen, als auch für den Nutzer Ihrer Webseite kein positives Signal. Wir möchten Ihnen im heutigen Blog-Beitrag zeigen, was die größten Fehler sind die Duplicate Content erzeugen und wie Sie für die jeweiligen Problematiken eine schnelle Lösung finden.

Duplicate Content entsteht grundsätzlich dann, wenn die gleichen oder sehr ähnliche Inhalte über verschiedene URLs aufrufbar sind. Dies kann sowohl Intern (auf der eigenen Webseite) oder auch Extern (gleiche Inhalte auf verschiedenen Domains) auftreten.

Interner Duplicate Content

Interner Duplicate Content ist die wohl am häufigsten vorkommende Art. Sie ist oftmals einer mangelhaften Programmierung oder auch der Unwissenheit geschuldet, wie man richtig mit den Inhalten der eigenen Seite umgeht. 

www. und non-www Version einer Webseite

Sobald Ihre Webseite sowohl unter www.ihrewebseite.de, als auch unter ihrewebseite.de zu erreichen ist und dort die gleichen Inhalte ausgeliefert werden, produzieren Sie doppelte Inhalte. Dieser Fehler ist mit einer der häufigsten, die wir in unseren SEO-Audits finden.

Obwohl die heutigen Content-Management Systeme wie zum Beispiele WordPress dieses Problem von Werk auf bekämpfen, taucht dieses Problem immer noch auf vielen Seiten auf.

Sie müssen dafür Sorge tragen. dass Ihre Webseite nur noch in einer Version ausgeliefert wird. Ob mit WWW. oder ohne bleibt Ihnen überlassen. Es hat sich jedoch bei den Nutzern etabliert eine URL beginnend mit WWW in den Browser zu tippen, daher raten wir Ihnen auch diese als Referenz zu nutzen.

Mittels eines 301-Redirects werden wir nun die Eingabe der URL ohne WWW auf die Version mit WWW umleiten. Tragen Sie dazu den folgenden Code in Ihre .htaccess-Datei ein, welche im Root-Verzeichnis Ihres Webspace liegen sollte.

RewriteEngine On

RewriteCond %{HTTP_HOST} !^www\.ihreurl\.de$

RewriteRule ^(.*)$ http://www.ihreurl.de/$1 [L,R=301]

Falls bisher keine .htaccess- Datei existiert, erhalten Sie hier eine Anleitung wie Sie eine .htaccess-Datei erstellen.

http und https Version stehen zur Verfügung

https-verschluesselung

Google verkündete am 06.08.14, dass die Verschlüsselung einer Webseite als positives Signal in der organischen Suche gewertet wird. Hier finden Sie den Link zu offiziellen Meldung.

Seit dem haben viele Webmaster damit begonnen Ihre Webseite mittels https zu verschlüsseln. Auch wenn die Verschlüsselung grundsätzlich als positiv zu sehen ist, kann hier eine Fehlerquelle geschaffen werden.

Sobald Ihre Webseite sowohl in der http-Version, als auch in der HTTPS-Version aufrufbar ist, erzeugen Sie Duplicate Content. Tragen Sie dafür Sorge, dass Ihre Webseite nur noch unter der HTTPS-Version zu erreichen ist. Alle HTTP-Anfragen müssen mittels 301-Redirect auf die HTTPS-Version umgeleitet werden.

Nachfolgend haben wir für Sie bereits den kompletten Code für Ihre .htaccess-Datei bereit gestellt. Bitte fügen Sie diesen wie nachstehend ein.

RewriteEngine On

RewriteCond %{HTTPS} off

RewriteRule (.*) https://%{HTTP_HOST}%{REQUEST_URI} [R=301,L]

Neben der oben genannten Weiterleitung per .htaccess, sollte auch die gewünschte korrekte Canonical-URL gesetzt werden. In diesem Fall ist es die Version mit HTTPS

<link rel=“canonical“ href=“https://www.ihreurl.de„>

Beachten Sie jedoch das der Canonical-Tag für jede Unterseite individuell angepasst werden muss und nicht pauschal auf die Startseite zeigen darf.

Mobile Friendly URLs und Druck-Versionen

Druckansicht auf Webseite

Fertige Content Management Systeme können bequem im Setup und Betrieb sein. Auch die Nutzerfreundlichkeit kommt nicht zu kurz, jedoch wird die Suchmaschinenfreundlichkeit oftmals vernachlässigt.

Ein Problem, was in diesem Zusammenhang besonders häufig vorkommt, ist das Ausliefern der mobilen Inhalte unter einer gesonderten URLs. Aus Sicht der Nutzer sauber gelöst, jedoch für Suchmaschinen liefern wir auch hier die gleichen Inhalte unter verschiedenen URLs aus.

Das gleiche Problem tritt auch bei Inhalten auf, welche speziell für Drucker aufbereitet worden sind. Oftmals werden nur Texte von Webseiten ausgegeben, ohne Bilder und weitere Formatierung in CSS.

Häufig werden diese Druckansichten dann unter gesonderten URLs ausgegeben. Diese URLs duplizieren auch wieder die bereits unter anderen Adresse vorhandenen Inhalte. Auch an dieser Stelle produziert unsere Webseite Duplicate Content.

Diese Seiten sollten Sie mittels der Angabe meta-robots im <head> einer Seite aus dem Index der Suchmaschinen ausgeschlossen werden.

<meta name=“robots“ content=“noindex, follow“>

Alternativ kann auch der Canonical-Tag auf den ursprüngliche URL gesetzt werden, um den Ursprung des Inhaltes zu definieren.

Es sollte jedoch nur auf eine der beiden Varianten zurück gegriffen werden, um dieses Duplicate Content Problem zu beheben.

Paginierungen als Duplicate Content Falle

Pagninierung von Artikel im Shop

Diesen Fehler finden wir regelmäßig in Online Shops, hinweg über alle gängigen Shop-Systeme. Der versierte Shopbetreiber hat bereits die Kategorien seines Shops optimiert und maschinenauslesbare Inhalte geschaffen. Dies ist aus Sicht der Suchmaschinenoptimierung ein korrektes Vorgehen.

Kritisch wird es oftmals erst dann, wenn die Produkte einer Kategorie über mehrere Seite aufgeteilt werden (Paginierung). Dies führt in vielen Shop-Systemen zu doppelten Inhalten.

Kategoriebeschreibungen die bisher nur auf der ersten Seite dieser angezeigt wurden, werden nun auch auf den paginierten Seiten angezeigt. Somit wird der selbe Inhalt auch unter solchen URL-Konstrukten angezeigt shop-system.de/kategorie?p=2

Und schon haben wir auch an dieser Stelle ein Problem mit doppelten Inhalten.

Zur Lösung sollten mehrere Ansätze verfolgt werden. Auch hier sollten Sie mittels meta-robots noindex, follow die paginierte Seite aus dem Index nehmen.

<meta name=“robots“ content=“noindex, follow“>

Zusätzlich kann bei einer Paginierung jedoch auch noch mittels des Canonical-Tags der Suchmaschine gezeigt werden, das die paginierte Seite nur eine weitere Version der Ursprungsseite ist. Legen Sie daher den Canonical-Tag jeweils auf die erste Kategorie-Seite.

<link rel=“canonical“ href=“http://www.shop-system.de/kategorie/“ />

Eine weitere Möglichkeit die Zusammenhänge zwischen den einzelnen paginierten Seiten für Suchmaschinen verständlich zu machen, besteht durch das rel=”prev” bzw. rel=”next” -Element. Auf diese Weise können vor und auch nachgelagerte Seiten einer Paginierung deklariert werden.

Beispiel: Sie befinden sich auf der folgenden URL: http://www.shop-system.de/kategorie/?p=2 , so würde der folgende Code ausgewiesen werden.

<link rel=“prev“ href=“https://www.shop-system.de/kategorie/“ />
<link rel=“next“ href=“https://www.shop-system.de/kategorie/?p=3″ />

Die erste Seite einer Paginierung enthält jeweils nur das Next-Element und die letzte Seite einer Paginierung nur das Prev-Element. Dies hilft der Suchmaschine die Zusammenhänge zwischen den paginierten Seiten besser zu verstehen.

Externer Duplicate Content

Externer Duplicate Content liegt dann vor wenn identischer oder auch sehr ähnliche Inhalte (Near Duplicate Content) über verschiedene Domains erreichbar ist.

Übernahme von Herstellertexten im Shop

Hersteller Texte in Shops

Shopbetreiber lieben einfache und vor allen Dingen Zeit sparende Vorgänge. Was liegt da näher, als die Produktbeschreibungen der Hersteller einfach im eigenen Shop zu übernehmen, es steht doch alles wichtige für den Kunden drin. Dies ist jedoch aus Sicht der Suchmaschinenoptimierung ein fataler Fehler. Die Suchmaschinen möchten das Sie auf Ihrer Webseite möglichst einzigartige Inhalte schaffen und nicht bereits vorhandene übernehmen.

In Ihrem Shop werden Sie nun das Problem haben, dass Sie kaum eine Chance haben werden zu Ihren Produkten zu ranken, da der Urheber des Texte der Hersteller war und dies wissen Suchmaschinen inzwischen ganz genau.

Schreiben Sie für Ihre Produkte einzigartige Inhalte. Beschreiben Sie Ihre Produkte mit eigenen Worten, nehmen Sie diese in die Hand, riechen Sie daran. Sie werden merken, dass man alleine durch die Haptik und Olfaktorik schnell eine ansprechende Artikelbeschreibung zusammen hat. Seien Sie kreativ, es wird Ihnen mit interessierten Besuchern honoriert werden.

Pressemitteilungen als DC Falle

Sie haben ein neues Produkt oder eine Dienstleistung auf den Markt gebracht und möchten nun, dass die Welt davon erfährt? Was bietet sich hier mehr an, als eine Pressemitteilung schreiben zu lassen und diese zu verbreiten!

Jedoch lauern in Pressemitteilungen gleich mehrere Fallen. Zum einen werden Ihre Inhalt oftmals über hunderte Presseportale verteilt. Dies kann in den Augen von Google bereits als Spam und Manipulation der Suchergebnisse gewertet werden. Zum anderen, wenn die Pressemitteilung auch noch auf der eigenen Seite publiziert wird, entsteht ein Duplicate Content Problem.

Auch sollten Sie sich an dieser Stelle die Frage stellen ob eine Pressemitteilung über einen solchen Verteiler überhaupt die richtige Zielgruppe findet.

Wir empfehlen Ihnen keine Pressemitteilungen über Presseverteiler oder Presseverzeichnisse zu versenden bzw. zu publizieren.

Contentdiebstahl

Es ist leider keine Seltenheit mehr, dass selbst erstellte Inhalte von der Konkurrenz kopiert werden und auf der eigenen Seite eingestellt werden. Auch dies ist für eine optimale Positionierung in den Suchmaschinen nicht förderlich.

Wir empfehlen Ihnen an dieser Stelle, Ihre Webseite regelmäßig mit Tools wie copyscape oder ähnlichen zu überwachen.

Wie erkenne ich Duplicate Content?

Internen Duplicate Content können Sie am einfachsten mittels der Google Search Console (ehemals Google Webmaster Tools) ermitteln. Hier erhalten Sie im Reiter “Darstellung in der Suche” erste Aufschlüsse über mögliche Probleme.

Doppelte Metabeschreibungen und auch doppelte Title-Tags sind Anhaltspunkte für Contentprobleme auf der Webseite. Diese sollten Sie sich genauer ansehen und entsprechende Maßnahmen treffen um diese Probleme zu beheben. Eine Reihe von Möglichkeiten haben wir Ihnen in unserem Artikel bereits genannt.

Externen Duplicate Content können Sie mittels Tools wie copyscape oder auch plagaware erkennen und entsprechende Maßnahmen treffen. Hilfe verspricht an dieser Stelle, die eingehenden Links auf die eigene Domain zu tracken, denn oftmals wird neben dem Text auch die komplette Linkstruktur von Webseiten mit kopiert.

Wir hoffen, dass wir Ihnen mit unserem Artikel eine kleine Hilfestellung geben konnten. Kennen Sie noch mehr häufig vorkommende DC-Probleme? Dann schreiben Sie uns diese als Kommentar und wir werden diese mit in unsere Liste aufnehmen und Ihnen auch hier eine Lösung für die Problematik anbieten.

Liebt Suchmaschinen und liebt Traffic. Immer auf der Suche nach neuen Trends und Taktiken, um Ihre Webseite zum Erfolg zu bringen. Sie möchten auch mehr aus Ihrer Webseite holen? Dann nehmen Sie noch heute Kontakt zu uns auf!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Ihr Weg zu mehr Besuchern und Umsatz