htaccess

Eine .htaccess Datei ist eine Konfigurationsdatei für NCSA-kompatible Webserver (wozu z.B. der Apache HTTP Server der Apache Software Foundation zählt). In der .htaccess Datei können verzeichnisbezogene Regeln definiert werden. Die Regeln gelten jeweils für das Verzeichnis in dem die Datei liegt und betrifft auch die Verzeichnisse unterhalb dieser Ebene. Mit einer weiteren Datei in einem Unterverzeichnis können übergeordnete Regeln jedoch wieder überschrieben werden.

Über die Regeln in der .htaccess Datei können Verzeichnisse und einzelne Dateien auf einer Server zugriffsgeschützt werden, Fehlerseiten definiert und Server interne Weiterleitungen (Redirect) gesetzt werden. Da die Datei bei jeder Abfrage des Webserver abgefragt wird, treten Änderungen sofort und ohne Neustart in Kraft.

Einsatzmöglichkeiten von htaccess

Wie beschrieben gibt es verschiedene Einsatzmöglichkeiten für die Regeln in der htaccess Konfigurationsdatei. Die meist genutzte dürfte jedoch das Weiterleiten auf eine von der Anfrage abweichenden URL sein. Damit der Websever Anweisungen einer htaccess interpretieren kann, benötigt er einen Interpreter. Im Falle des weit verbreiteten Webserver Apache wird das Modul mod-rewrite benötigt. Das Modul mod-rewrite ist auf den meisten Server bereits vorinstalliert und aktiviert.

Redirect auf Grund von Änderungen in der URL-Struktur

Wenn sich die URL-Struktur vollständig oder teilweise ändert können mit Regeln in der .htaccess Datei alte URLs auf neue URLs umgeleitet werden. Änderungen an der Struktur treten z.B. in jedem Fall bei einem Domainwechsel oder einer Umstrukturierung der Website auf. Auch bei einem Relaunch der Webseite ist es sehr wahrscheinlich, dass sich Änderungen an der URL-Struktur ergeben. R=301 gibt an, dass bei der Umleitung der http Statuscode 301 gesendet werden soll. Dieser Code gibt an, dass die Umleitung permanent besteht und informiert Crawler, dass die Ressource dauerhaft verschoben wurde.

RewriteRule ^altes-dokument.html$ /neues-dokument.html [R=301,L]

Umleitung auf eine Domain mit „www.“

Eine Domain kann grundsätzlich direkt und ohne den Zusatz „www.“ aufgerufen werden. Der Zusatz „www.“ stellt strenggenommen nur eine Subdomain da. Da der Gebrauch jedoch weit verbreitet ist nehmen viele User an, dass das „www.“ fester Bestandteil der Webadresse ist. Technisch ist es jedoch möglich unter den Seiten beispiel.de und www.beispiel.de zwei völlig unterschiedliche Webseite zu betreiben. Da dies jedoch zu Verwirrungen führen würde, ist es üblich sich für eine Standard Variante zu entscheiden und die jeweils andere umzuleiten. Auch werden durch die Umleitung auf eine Variante doppelte Inhalte (Duplicate Content) vermieden.

RewriteEngine On
RewriteCond %{HTTP_HOST} ^webseite.de$ [NC]
RewriteRule ^(.*) http:// www.beispiel.de /$1 [L,R=301]

Redirect auf eine andere Domain

Oftmals sichert man sich als Webmaster viele unterschiedliche Domains. Dies kann unterschiedliche Gründe haben. Internationale Tätigkeit, ähnliche Schreibweise oder unterschiedliche Top-Level-Domains (z.B. .de, .com, .net) können der Grund sein. Oftmals finden dann alle Aktivitäten jedoch unter einen einzelnen Domain statt. Alle anderen Domains sollen zu dieser zentralen Domain umgeleitet werden.

Redirect 301 / https://www.domain.de

Dynamische URLs umschreiben

Viele Content Management und Shop Systeme geben dynamische URLs mit Parametern aus. Solche URLs sind jedoch zum einem für Suchmaschinen nicht gut zu verarbeiten und zum anderen für Menschen auch nicht greifbar. So kann ein Mensch eine URL „lesen“ wenn sie z.B. beispiel.de/sport/fussball/champions-league/ lautet. Mit einer URL wie beipiel.de/?c=123 kann ein Mensch hingegen nichts anfangen. Solche dynamischen URLs können mittels htaccess in statische ULRs umgeschrieben werden, welche als suchmaschinenfreundlich gelten.

Passwortschutz mit .htaccess

Mit Regeln in der der .htaccess Datei können auch Verzeichnisse auf dem Webserver vor dem Zugriff geschützt werden.

 AuthType Basic
 AuthName "Bezeichnung"
 AuthUserFile /htdocs/.htpasswd
 Require valid-user

Der Verweis der unter AuthUserFile führt zu einer Datei mit dem Namen htpasswd in der Benutzernamen und mittels Hashfunktion verschlüsselte Passwörter gespeichert sind. Der Eintrag /htdocs/ gibt das zu schützende Verzeichnis an.

Bilder mittels .htaccess schützen

Gute Bilder und Grafiken werden im Internet leider immer noch als Freiwild betrachtet. Die Bilder werden kopiert oder ohne Erlaubnis an anderer Stelle eingebunden. Teilweise sogar vom Webserver des Eigentümers aus, so dass diesem beim illegalen Aufruf auch noch Traffic und im Zweifel Kosten verursacht werden. So entsteht dem Bildeigentümer sogar ein doppelter Schaden. Der Bilddiebstahl kann jedoch mittels .htaccess verhindert werden.

RewriteCond %{HTTP_REFERER} !^http:// www.beispiel.de/ [NC]
RewriteCond %{HTTP_REFERER} !^$
RewriteRule \.(jpe?g|gif|png)$ - [F]

Diese Regel ist zweistufig aufgebaut. Im ersten Teil wird die eigene Webseite als Ausnahme hinzugefügt, damit die Darstellung der Bilder auf der eigenen Webseite noch funktioniert. Im zweiten Teil wird der Aufruf durch externe Quellen unterbunden, so können Bilder nicht mehr in Fremdsysteme eingebunden werden. Wird ein Bild von extern aufgerufen gibt der Webserver eine Fehlermeldung zurück.

Das Format einer .htaccess Datei

Der Punkt zu Beginn der .htaccess stammt aus der UNIX-Welt. Dateien mit einem Punkt am Anfang sind verzeichnisspezifische Konfigurationsdateien welche versteckt sind. Das heißt, diese Dateien werden in herkömmlichen Dateimanagern nicht dargestellt und auch auf der Konsole wird dem Nutzer die Datei nur mit dem Kommando „ls -a“ angezeigt. Bei einigen FTP Programmen kann es daher dazu kommen, dass Sie eine .htaccess nicht sehen können. .htaccess Dateien sind Textdateien und können mit jedem belibigen Texteditor bearbeitet werden.

Bedeutung für die Suchmaschinenoptimierung (SEO)

Insbesondere die Möglichkeit der Redirects ist für die Suchmaschinenoptimierung von großer Bedeutung. Änderungen an der URL Struktur sind an der Tagesordnung, haben jedoch den Nachteil, dass durch die Änderungen Rankings verloren gehen. So trifft man nicht selten in der Praxis darauf, dass ein Unternehmen einen Webseiten Relaunch durch eine Internetagentur durchführen lässt und sich dann im Anschluss wundert, dass die eigene Webseite plötzlich so schlecht zu finden ist. Die Erklärung ist jedoch recht einfach. Rankings werden immer nur genau einer URL zugeordnet. Ändert sich diese und der (Such)Maschine wird kein Hinweis gegeben wo das neue Dokument zu finden ist, so verschwinden die Rankings. Die alte URL existiert schließlich nicht mehr. Daher müssen bei Änderungen an der URL-Struktur alle alten URLs einer Domain mittel einer 301-Weiterleitung auf die neue Ziel Ressource umgeleitet werden. Die 301-Weiterleitung informiert den Crawler, dass das Dokument dauerhaft unter einer neuen URL zur Verfügung steht. Zudem werden Nutzer auf die korrekte neue URL weitergeleitet, Lesezeichen funktionieren weiterhin und Backlinks laufen nicht ins Leere. Und nicht zuletzt wird bei einer 301-Weiterleitung der PageRank weitervererbt.

Eine weitere zentrale Bedeutung kommt den Weiterleitungen bei der Duplicate Content Problematik zu. Zwar wird Duplicate Content nicht, wie vielfach angenommen, unmittelbar von Google & Go. abgestraft, jedoch können doppelte Inhalte dazu führen, dass Ranking-Potenziale nicht voll ausgeschöpft werden können, da sich die doppelten Inhalte gegenseitig Konkurrenz machen. Webmaster sollten also Inhalte immer nur unter einen eindeutigen URL ausliefern. Dazu gehört auch die Entscheidung für eine Variante mit oder ohne „www“. Der Canonical Tag kann zwar dabei helfen, mehrfache URLs unter einer bevorzugten Variante, einer so genannten kanonischen URL, verfügbar zu machen. Eine saubere URL-Struktur ist dieser Variante jedoch immer zu bevorzugen, da der Canonical Tag lediglich eine Empfehlung darstellt. Es kommt durchaus auch vor, dass dieser auf Grund einer fehlerhaften Implementierung ignoriert wird.

Es bleibt also festzuhalten, dass der htaccess Datei eine große Bedeutung zukommt. Denn wird sie fehlerhaft eingesetzt können aus SEO Sicht große Probleme auftauchen und Rankings verloren gehen bzw. erst gar nicht entstehen.

Quellen

Ihr Weg zu mehr Besuchern und Umsatz