Skip to content

Entitäten

Definition 

Der Begriff der Entität ist ein Fachbegriff aus der Philosophie, der in die Informatik übernommen wurde. Die Philosophie entwickelte ihren Entitätsbegriff aus dem lateinischen „ens, entitas“ (Seiend, Ding‘) und verwendet ihn doppelt: Mit Entität kann ein konkret oder abstrakt existenter Gegenstand bzw. Einheit von Gegenständen gemeint sein – ein Ding, Sachverhalt, Ereignis; eine Eigenschaft oder eine Relation. So wird der Begriff auch im allgemeinen Sprachgebrauch und in der wissenschaftlichen Fachsprache verwendet: Entität als (gegebene) Größe, Einheit. Der Begriff Entität kann aber (darüber hinaus bzw. vor allem) auch das Wesen dieser Einheit beschreiben, im Sinne aller seine Existenz und Identität/Individualität bestimmenden Elemente.

Der Entitätsbegriff in der Informatik nimmt in gewissem Sinne beide philosophischen Bedeutungen auf: Die „digital entity“ oder digitale Entität bezeichnet das eindeutig zu bestimmende – materielle oder immaterielle, konkrete oder abstrakte – Informationsobjekt, über das Daten gespeichert oder verarbeitet werden sollen: Eine Person oder ein Konto, eine Maschine oder einen Zustand; oft bildet die digitale Entität zugleich die digitale Identität.

Aus all diesen Ansätzen hat Google einen firmeneigenen Entitätsbegriff entwickelt. Der Such-Algorithmus soll den gesamten, im Text einer Website zum Ausdruck kommenden semantischen Raum erfassen, um aus diesem auf die „Entität“ zu schließen, die das Thema der jeweiligen Website ist. Dann wird bewertet, wie gut und umfassend diese Website diese Entität behandelt – um anschließend die Seite ganz nach vorne zu sortieren, die die jeweilige Entität für den Nutzer am besten darstellt oder zusammenfasst.

Ein ehrgeiziges Unterfangen, das jedoch seit Jahren großen Einfluss auf das Ranking hat:

Ihr

Ansprechpartner

Khalil Agheli Zadeh Geschäftsführer
Khalil Agheli Zadeh
Geschäftsführer

Die Rolle der Entitäten für das Ranking der Suchergebnisse

Die Algorithmen der Suchmaschinen-Software sind darauf ausgerichtet, die Seiten/Texte ganz nach oben zu stellen, die die Suchanfrage des Nutzers am besten beantworten.

Um herauszufinden, ob eine Seite ganz speziell einem bestimmten Thema gewidmet ist, wurden Anfangs nur die eingehenden Links und dann auch Keywords (Schlüsselwörter) bewertet/gezählt: Es ist wahrscheinlich, dass eine Seite mit Anlage, Kauf und Pflege von Rasen zu tun hat, wenn auf dieser Seite 20 mal das Wort Rasen auftaucht, schloss die Suchmaschine haarscharf.

Leider nicht immer zielführend: Schon damals gab es Autofahrer, die „Rasen“ als persönliche Lieblingsbeschäftigung ansahen. Artikel von Schutzorganisationen, die auf das „Rasen als Volkssport“ aufmerksam machen wollten, blieben jedoch weit zurück hinter den Seiten, die (den) Rasen auch im Domainnamen („Schöner-Rasen-GmbH“) und in jeder Bildunterschrift trugen („gesunder … frisch vertikutierter … moosbewachsener etc. Rasen). Die Verkehrswacht XY (mit gleichlautendem Domainnamen ganz ohne Rasen) schreibt auch vor allem über Raser und veröffentlicht Fotos von Raser-Unfällen. Außerdem wurden beide Seiten sowieso ganz schnell von Seiten abgehängt, die Rasen in Deutschland, Österreich und der Schweiz, für Paare und Singles, mit oder ohne Sex und so weiter auflisteten (egal ob „grün“ oder „gefährlich“, weil es außer den Listen mit 200 mal Rasen keinen Text gab).

Weil es keinen Nutzer befriedigt, mit solchem Quatsch ganz oben bei den Suchergebnissen empfangen zu werden, begann Google ganz schnell mit der Weiterentwicklung des Such-Algorithmus.

Das Florida Update November 2003 führte die Abwertung von Seiten mit Keyword Stuffing ein. Seit dem Brandy Update Februar 2004 erkennt Google, wenn Synonyme der Kernbegriffe verwendet werden (und wertet das positiv, weil solche Texte das Thema in der Regel umfassender abdecken). Die Synonym-Erkennung wurde ab da in mehreren Updates verbessert, das Hummingbird Update August 2013 stellte den den Kern des Suchalgorithmus endgültig auf die Erkennung von semantischen Zusammenhängen statt auf einzelne Keyword oder Zählung von Keywords ab.

Google möchte ganz vorne die Seiten/Texte ausgeben, die eine klar eingrenzbare Entität möglichst umfassend behandeln. Google macht auch immer wieder deutlich, dass das für ein gutes Ranking wichtiger ist als die Keyworddichte. Wenn sich spätere Updates des Algorithmus mit dem Ranking nach Textinhalt bzw. Informationsgehalt beschäftigten, waren sie deshalb auch oft auf die verbesserte Erkennung semantischer Entitäten ausgerichtet (und daneben auf die Erkennung der Qualität des Text-Inhalts, die bei der Sortierung der Suchergebnisse ebenfalls eine zunehmend große Rolle spielt).

Inzwischen können gute und gut verständliche Texte mit einem treffenden „semantischen Set rund um einen Schlüsselbegriff“ ganz vorne in den Suchergebnissen auftauchen, ohne dass das eigentliche Keyword überhaupt enthalten ist. Wenn sich die Texte einer Seite und ihrer Unterseiten nicht mehr nur auf jeweils wenige Keywords beschränken, kann das weiter dazu führen, dass Google die gesamte Seite als Entität mit bestimmten Eigenschaften und Begriffen erfasst. Das wiederum kann dazu führen, dass Unterseiten dieser Website auch für Begriffe gut ranken, die auf dieser Seite nur als Hinweis auf Zusammenhänge oder auf andere Unterseiten auftauchen …

Beispiele für semantische Entitäten

Eine Entität umfasst im Grunde das gesamte semantische Umfeld eines Themas,: Alle Wörter oder Sätze und ggf. auch Zeichen und Symbole, die notwendig sind, um dieses Thema erschöpfend zu beschreiben.

Dabei kann fast jede eindeutig definierte Entität in viele weitere Entitäten untergliedert werden, deren Umriss erst durch zusätzliche Begriffe entsteht:

– In einem Text, der die Entität „Apple Inc.“ näher beschreibt, sollten sicher die Begriffe Konzern, Kalifornien, Steve Jobs, Macintosh, iMac, iPod, iPhone, iPad, iTunes und reichstes Unternehmen der Welt zu finden sein.

– Ein Text zu Apples Produktpolitik könnte sich beim Unternehmen auf Apple Inc.und Konzern beschränken, müsste aber dafür iMac, Mac Pro, MacBook, Apple Watch, die letzten iPhone-Modelle, die Begriffe App Store, iTunes Store und die Zukunftsprognosen von Experten erwähnen.

– Eine Apple-Kritik müsste die Begriffe Design-Obsoleszenz, Arbeitsbedingungen, Kundentäuschung, Umweltschutz, Zensur von Apps und Blogs, Aktienschummel, Steuervermeidung und mehrere weitere öffentlich kritisierte Punkte erwähnen.

Rund um Fahrräder können Entitäten von Modellbeschreibungen bis Umweltschutz/Co2-Einsparung gebildet werden; die Hanfpflanze gibt mehr als ein Dutzend verschiedener Entitäten von „ältester Nutzpflanze der Welt“ über Dämmung, Kleidung bis Schmerzmedizin her. In einer Stadt/Region bilden jeder Ort und Kiez, jeder Laden, jedes Unternehmen und jede regionale Spezialität eine Entität, und so weiter. Die Entitäten sind so vielfältig wie das Leben; jede Zielgruppe ist über ganz bestimmte Entitäten am besten zu erreichen.

Wie entstehen Texte, in denen Google eine bestimmte Entität erkennt?

Wenn Google vorrangig Webseiten belohnt, die dem Suchmaschinen-Benutzer eine Entität (oder mehrere zusammenhängende Entitäten) möglichst umfassend nahe bringen, die Entitäten aber andererseits erst aus den verwendeten Begriffen erkannt werden, ergeben sich daraus folgende Anforderungen an die Texterstellung bzw. die ganze Thematik einer Website:

– Eine Seite auf ein Thema fokussieren

– Alle Begriffe einbringen, die dem „Durchschnitts-User“ zu diesem Thema durch den Kopf gehen

– Nicht zu sehr vom Thema abschweifen (wer früher ständig die Korrekturnotiz „zu weit von Thema abgeschweift“ am Aufsatz stehen hatte, ist diesbezüglich gefährdet)

– Lieber einen zusammenfassenden Überblick und mehrere, detaillierte Unterseiten

Verschiedene Suchmaschinen-Optimierer versuchen, sich dieser anspruchsvollen Art der Texterstellung über Vorauswahl von Synonymen zu nähern, die von LSO Tools oder WDF*IDF-Tools erstellt werden.

LSO Tools kümmern sich um „latent semantische Optimierung“, indem sie die bedeutungstragenden Begriffe für einen bestimmten Text (eine bestimmte Entität) ermitteln; praktisch eine Keyword-Suche unter Einbeziehung der gängigsten Assoziationen. WDF*IDF-Tools ermitteln die „Within Document Frequency“ (häufig vorkommende Worte, haben mehr Bedeutung für den Test) und die „Inverse Document Frequency“ (IDF, ein auch von allen anderen verwendetes Wort hebt den Text nicht von den Texten der Konkurrenz ab), um aus Kombination beider Faktoren die Relevanz eines Textes im Vergleich zu Texten auf anderen Webseiten zu ermitteln. Die genaue Erklärung [[kann den entsprechenden Glossar-Beiträgen entnommen werden / ist etwas komplizierter]], mit fortschreitender Entwicklung der Such-Algorithmen verlieren solche Tools jedoch zunehmend ihre Bedeutung.

Denn diese Tools entstanden aus Basis-Techniken der Such-Algorithmen oder wurden vor rund 10 Jahren als Antwort auf solche Basis-Techniken entwickelt. Sie bleiben ein nützliches Werkzeug, um Textentwürfe daraufhin zu kontrollieren, ob auch alle Begriffe enthalten sind, die der Durchschnittsbürger (der anvisierten Zielgruppe) mit dem Begriff verbindet.

Die Such-Algorithmen (vor allem die des „Vorreiters“ Google) berücksichtigen aber inzwischen viele weitere Bewertungsfaktoren. Diese sind über Keyword-Cluster und durch Synonyme gebildete Entitäten hinaus auf die Identifikation und Bevorzugung hochqualitativer Texte gerichtet, deren Inhalt der User vertrauen kann (siehe dazu das Glossar „EAT Guidelines“).

Wer eine Entität so beschreiben will, dass ein gutes Ranking folgt, sollte über Fachwissen und Erfahrungen in diesem Gebiet verfügen – und dieses Wissen so darstellen, dass der Inhalt auch von interessierten Laien unproblematisch verstanden wird. Die besten Texte zu einer bestimmten Entität entstehen deshalb schon immer (und heute um so mehr), wenn Experten mit einem hohen Maß an Fachwissen mit erfahrenen Autoren zusammenarbeiten, die dieses Fachwissen in allgemein verständliche Sprache umsetzen.

Da Googles Algorithmen nach verständlichen Texten suchen, ist für einen guten Text auch meist keine besondere Keyword- oder Synonym-Recherche notwendig. Denn die Begriffe, die zu einem Thema/einer Entität gehören, ergeben sich in aller Regel bei der Beschreibung dieses Themas/dieser Entität ganz von selbst. Nur bei sehr allgemeinen Themen checkt der für die Umsetzung in Laiensprache zuständige Autor vielleicht noch kurz anhand der Google One Box (Googles „Zusammenfassung des Suchthemas“ rechts auf der Seite), ob alle für die Allgemeinheit und damit für Google wichtigen Begriffe erwähnt werden.

Pluspunkt: Semantic Markup im HTML-Code

Bei der Ermittlung von Entitäten verlässt sich Google nicht nur auf semantische Zusammenhänge im Text, sondern zieht alle weiteren aussagekräftigen Elemente heran. Zu diesen Elemente gehört (in vorderster Reihe) der HTML-Code, weshalb es höchst sinnvoll ist, diesen in der passenden „Semantic Markup“ zu verfassen.

Die Möglichkeiten der Auszeichnung im HTML-Content gehen heute sehr weit über die Meta-Description hinaus, die wie die Meta-Keywords bei der Indexierung und Sortierung von Inhalten kaum mehr eine Rolle spielt.

Nicht vergessen: Gutes Ranking ist ein Rundum-Paket

Wenn eine Website eine gute und vollständige Beschreibung eines von Google als semantische Entität erkannten Themas bietet, ist sie sicher ein potentieller Kandidat für ein gutes Ranking. Wenn sie das Thema sehr gut, mit hohem EAT und vielen Verweisen auf (wissenschaftlich) allgemein anerkannte Quellen erfasst, ist inzwischen sogar „linkless ranking“ (gutes Ranking von Websites ohne eingehende „Backlinks“) möglich.

Darüber hinaus sollte/muss aber auch die gesamte Programmierung den Google-Richtlinien entsprechen, mit ihren vielen kniffligen und nicht leicht verständlichen Anforderungen. Auch die Anreicherung der Texte mit genau passenden Bildern (Bild-Unterschriften, Alt-Texten), zweckdienlichen Mini-Programmen etc. wird von Google meist belohnt; beides Punkte, bei denen Ihre Online-Marketing Agentur Sie kenntnis- und ideenreich unterstützen kann.

Bei Fragen oder Interesse nehmen Sie bitte einfach Kontakt zu uns auf.

SEO Deutschland – Die kreative SEO Agentur