Semantic Web

Semantic Web bezeichnet eine Technologie, bei der die Daten einer konventionellen Webseite um strukturierte Daten angereichert werden, um die Bedeutung der Information für Maschinen leichter auswertbar zu machen. Auf diese Weise sollen Maschinen die Bedeutung von Inhalten verstehen können. Das Semantic Web wird auch als Web 3.0 bezeichnet,.

Beispiel: Der Begriff Bank in einem Dokument kann sowohl eine Parkbank meinen, als auch eine Hausbank. Der Begriff Bank hat für eine Maschine keinen eindeutige Bedeutung. Ein Mensch kann hingegen aus dem Zusammenhang erschließen, welche Art von Bank gemeint ist, z.B. aus dem umgebenden Text, aus Bildern oder anderen Elementen. Beim Semantic Web wird dem Begriff eine eindeutige explizite Bedeutung zugewiesen, sodass die Maschine sofort erkennen kann welche Bank hier gemeint ist.

Hintergründe des Semantic Web

Bisherige Webtechnologien sind Syntax-orientiert und funktionieren auf Basis von Stichwörtern. Die Codes in den Algorithmen der Suchmaschinen wie Google durchsuchen die indexierten Dokumente nach den vom Nutzer eingegebenen Suchbegriffen. Das Problem dabei ist, dass viele Suchphrasen nicht eindeutig sind. So kommt es immer wieder dazu, dass Suchergebnisse (SERP) gezeigt werden, die mit der Nutzerintention nichts zu tun haben. Noch deutlicher wird es wenn ganze Fragen an eine Maschine gestellt werden. Gibt ein Nutzer die Frage „Warum wachsen in Deutschland keine Palmen?“ ein, dann kann eine heutige Suchmaschine nur Ergebnisse liefern, die diese Wörter verwenden. Das führt aber nicht immer zu sinnvollen Ergebnissen. Der Nutzer muss die richtige Frage stellen. Durch das Semantic Web sollen Maschinen nun in die Lage versetzt werden, nicht nur nach den Stichwörter zu suchen, sondern die Frage des Nutzer zu verstehen, Informationen in Beziehung zueinander zu setzen und entsprechend eine Antwort auf die Frage zu finden oder sogar direkt selbst zu liefern. Die Maschine soll die Semantik (Wissenschaft von der Bedeutung der Zeichen) verstehen lernen. Erste Ansätze hat Google mit dem Hummingbird Update entwickelt, welches die Basis für den Knowledge Graph bildet. Der Knowledge Graph liefert schon heute Antworten auf Fakten zu bekannten Persönlichkeiten, Orten, Unternehmen, Büchern oder Filmen. Auch werden strukturierte Daten von von einigen Suchmaschinen in den Suchergebnissen in Form von Rich Snippets genutzt um die Ergebnisse anzureichern.

Knowledge Graph Beispiel
Screenshot: Antwortbox Google Knowledge Graph

Technische Grundlagen des Semantic Web

Um Informationen in Beziehung zueinander zu setzen und eine gemeinsame Basis zu erhalten, gibt es verschiedene Ansätze. Zum einen gibt es die so genannte Contextual Browsing Language (CBL). Mit dieser Sprache können Informationen in Relation zueinander gesetzt werden. Zusätzlich können die Verbindungen zueinander gewichtet werden. Zum anderen gibt es die Web Ontology Language (OWL). In dieser semantischen Sprache werden Informationen klassifiziert und in eine Hierarchie eingeordnet. Viele dieser Standards werden von der Organisation W3C entwickelt.

Weitere Standards, welche bei der Umsetzung des Semantic Web helfen, sind die Folgenden:

  • RDF/RDFa (Resource Description Framework in Attributes): Das RDF ist ein Datenmodell zur Repräsentation von Aussagen. Das Modell basiert auf gerichteten Graphen und dient zur genaueren Beschreibung vom Webseiteninformationen. Mittels der Erweiterung RDFa kann RDF in XML-Dokumenten (wozu auch XHTML zählt) eingefügt werden.
  • RDFS (Resource Description Framework Schema): RDFS dient zur Deklaration des RDF Vokabulars. Ähnlich wie DTD (Document Type Definition) bei XML, legt RDFS Struktur und Syntax für den Datenaustausch fest.
  • Dublin Core: Dient der Interpretation der in RDF beschriebenen Elemente und beinhaltet eine Sammlung an einfachen und standardisierten Konventionen. Die Daten werden in Form von Metadaten hinterlegt.
  • RIF (Rule Interchange Format): RIF ist eine Art Übersetzungssprache bzw. Empfehlung zum Umgang mit Übersetzungen und Austausch von Beschreibungsregeln zwischen den verschiedenen Standard des semantischen Webs. Es hilft die Interoperabilität zu gewähren.
  • SPARQL (SPARQL Protocol And RDF Query Language): Ist ein Abfragesprache um auf RDF Graphen zuzugreifen.
  • URI (Uniform Resource Identifier): URIs haben im Semantic Web ein doppelte Rolle. Sie dienen der eindeutigen Identifizierung von Entitäten und zum Verweis auf weiterführende Daten, welche auch als Linked Open Data (LOD) bezeichnet werden.
  • Bespiele für Sprachen die RDF-Graphen austauschen können: RDF/XML (einzige bisher standardisierte Syntax) JSON-LD, RDFa oder Turtle.

Bedeutung für das Online Marketing

Heute wird Online Werbung noch oft in einem unrelevanten Umfeld ohne passenden Bezug zur Nutzerintention ausgeliefert. Durch das semantische Web wird man wahrscheinlich künftig in der Lage sein, die genauen Nutzerinteressen zu erkennen und Werbung deutlich stärker Kontext bezogen auszuliefern. Damit  wird Werbung ohne Zusammenhang immer weniger von den Rezipienten wahrgenommen. Auch die Bedeutung von digitalen Marken wird in diesem Zusammenhang immer wichtiger werden.

Auch auf die Suchmaschinenoptimierung (SEO) wird das Semantic Web eine große Auswirkung haben. Die Ausarbeitung von Inhalten wird deutlich komplexer werden, ebenso die technischen Anforderungen. Webkonzerne wie Google forschen seit langem auf dem Gebiet und versuchen ihre Algorithmen immer intelligenter zu machen. Noch steckt das „schlaue“ Netz noch in den Kinderschuhen, aber die Auswirkungen lassen sich schon erahnen. Unternehmen die heute in strukturierte Daten und holistische Inhalte investieren, können schon bald einen großen Wissensvorsprung haben, der nicht so leicht aufzuholen ist. Google schafft es, inzwischen mit Rank Brain sogar noch unbekannte Suchanfragen einer Thematik zuzuordnen. Diese Machine Learning Technologie macht immer größere Fortschritte und die Manipulation der organischen Suchergebnisse wird immer schwieriger.

Kritik

Einige kritische Stimmen sagen, dass ein echtes semantisches Netz nicht funktionieren können, da selbst innerhalb einer Bibliothek ein Ontologie nicht funktionieren würde, da diese zu stark auf eine bestimmte Sichtweise ausgerichtet sein. Auf Grund der formalen Gegebenheiten sein genau wie bei der Ontologie, auf denen das Semantic Web basiert, zu strikte Regeln eingeführt worden. So könne die Kompressibilität des gesamten Webs nicht geschrieben werden. Auch wird kritisiert, dass die derzeitigen Standards auf unausgereifter Technologie basieren, welche zudem zu komplex sein. Eine weitere Gefahr des Semantic Webs besteht darin, dass Traffic und CTR abnehmen, wenn Seiten aufgrund von technischer Fehler nicht mehr in den Suchergebnissen auftreten.

Quellen

Ihr Weg zu mehr Besuchern und Umsatz