Mikrodaten
Inhalt
Definition
In diesem Glossarbeitrag geht es um Mikrodaten, mit denen das Markup [Link] einer Website präzisiert werden kann. Der Sinn dahinter ist, den Inhalt einer Seite für Google perfekt zu strukturieren und „semantisch“ lesbar zu machen. Für Inhalte, die die Leser begeistern, kann das positive Auswirkungen auf das Ranking haben.
Ihr
Ansprechpartner
Mikrodaten: Allgemeine Infos
Mikrodaten gehören in den Bereich Auszeichnungssprachen. Diese Markup Languages legen fest, wie ein Inhalt interpretiert und verarbeitet und in welcher Form er an den Nutzer ausgegeben werden soll. Die maschinenlesbaren Auszeichnungssprachen für Internet-Veröffentlichungen markieren Inhalte in vielfältiger Form, um sie für die jeweiligen Nutzer gut erfassbar zu machen.
Normale Webseiten sind für Nutzer allein dadurch erfassbar, dass sie in der allgemeinen Auszeichnungssprache HTML ausgezeichnet werden. Der „Erfinder“ des WWW, der Informatiker und Physiker Tim Berners-Lee, hat diese Auszeichnungssprache mitgeliefert, als er das neue Informationsnetz im August 1991 der Allgemeinheit frei und kostenlos zur Verfügung stellte. Dieses Grundprinzip des freien Informationsaustauschs funktioniert auch nach wie vor: Selbst die allererste Website der Welt, info.cern.ch, kann heute noch von jedem Internetnutzer abgerufen und gelesen werden Auch heute noch kann eine Website einfach nur in HTML geschrieben werden und von jedem Nutzer überall in der Welt abgerufen werden.
Dieser Abruf setzt bloß die Kenntnis der URL voraus, der Adresse, unter der eine bestimmte Website im Netz zu finden ist. Die Suche nach Informationen setzt deshalb Adress-Verzeichnisse voraus, die anfangs ähnlich wie Bibliothekskataloge aussahen (Web-Kataloge). Bald entstanden Suchmaschinen, die dem Nutzer das Durchblättern des Adressen-Kalalogs abnahmen, indem sie die zur Suchanfrage passenden Seiten über einen Such-Algorithmus ermitteln ließen. Googles Algorithmus führte die Sortierung der Suchergebnisse nach Nutzer-Empfehlungen ein und konnte sich damit schnell durchsetzen.
Darüber hinaus hat Google zusammen mit anderen Suchmaschinenbetreibern längst spezielle Internet-Auszeichnungssprache entwickelt, mit der sich der Inhalt einer Website besonders gut für die Suchmaschine kennzeichnen lassen soll. Zur dieser speziellen Suchmaschinen-Auszeichnungssprache gehören auch die Mikrodaten, im engeren und im weiteren Sinne.
Markup und Mikrodaten für Suchmaschinen
Zur Pflege und Weiterentwicklung offener, diskriminierungsfreier Internet-Auszeichnungssprachen hat Berners-Lee am MIT Laboratory for Computer Science in Cambridge das unabhängige World Wide Web Consortium W3C gegründet, das seitdem neues HTML, viele weitere Auszeichnungssprachen z. B. für Medizin und Flugsicherheit, Standards für barrierefreies HTML usw. entwickelt hat.
Seit 2004 beeinflussen die Großen der Branchen, die mit dem Internet Geld verdienen, über die Organisation WHATWG mit ihrer Marktmacht die HTML-Entwicklung. Erst Mai 2019 konnte die WHATWG (mit Apple, Mozilla, Microsoft und Google als führenden Akteuren) durch eine Vereinbarung soweit in eine Zusammenarbeit mit dem W3C eingebunden werden, dass konkurrierende Standards bei der Kernsprache des Web in Zukunft (hoffentlich) vermieden werden.
2011 taten sich Google, Bing (Microsoft) und Yahoo in der Initiative Schema.org zusammen und entwickelten das gleichnamige, spezielle Markup für Suchmaschinen. Schema.org stellt Markup zur Verfügung, um verschiedenste Datentypen (wie Branche/Geschäftszweig und Produktbeschreibungen, Bewertungen, Filme und FAQs) für die Suchmaschinen besser erkennbar zu machen (mehr dazu siehe Artikel Markup [Link]).
Schema.org wurde aus der Syntax des Formats „Microdata“ heraus entwickelt, einem der Mikroformate, um die es in diesem Glossar-Beitrag geht. Der Blick auf die Entwicklungsgeschichte der gängigen Mikroformate legt weitere enge Verwandtschaften offen:
Mikrodaten und Mikroformate
Das W3C hat mit dem Resource Description Framework (RDF) schon 1997 ein Mikrodaten-Format entwickelt, um den Nutzern selbst eine genaue, individuelle Auszeichnung ihrer Inhalte zu ermöglichen. Dieses „System zur Ressourcen-Beschreibung“ sieht eine logische Beschreibung beliebiger Ressourcen (Dinge, Informationsinhalte) nach der Grundstruktur eines Satzes vor: Über Subjekt, Prädikat, Objekt, die global nach URL-Konvention geformt werden, kann jede „Ressource“ eindeutig gekennzeichnet werden.
Aus dem ursprünglich nur zur Beschreibung von URLs gedachten RDF wurde ab 1999 RDF-Schema entwickelt und ab 2004 RDFa (RDF in ahref-Attributen) als erste Technologie eines „semantischen Webs“. Seit RDFa 1.1 kann RDF in HTML eingesetzt werden, hier geht es zur die aktuellen Version: www.w3.org/TR/rdfa-core und zur aktuellen Version des Einsteiger-Subsets RDFa Lite: www.w3.org/TR/rdfa-lite.
Ein paar Jahre später wurde auf der Basis von RDF das Format „Microdata“ entwickelt. Den ersten Anstoß dazu gab 2009 Ian Hickson, der zunächst bei Opera Software arbeitete, einem Gründungsmitglied der WHATWG: Um spezifische Anwendungsfälle und ihre Szenarien zu adressieren (beschreiben), hat er damals in HTML5 eine einfache, auf RDFa basierende Syntax mit drei neuen Attributen hinzugefügt (die nicht die volle Leistung von RDF hat, weil das nicht notwendig erschien, vgl. web.archive.org/web/20091212053447/http://ajaxian.com/archives/hixie-discusses-the-addition-of-html5-microdata, Ian Hickson arbeitet inzwischen für Google als Spezifikationseditor der WHATWG).
Das W3C hat aber auch in dieser Richtung weitergearbeitet und JSON-LD entwickelt, mit dem sich in RDF beschriebene Daten ins „schlanke“ JSON-Format einbetten lassen. Das erleichtert Services und Applikationen, die v. a. Daten in JSON (JavaScript Object Notation) austauschen, die semantische Markierung ihrer Inhalte (ohne RDF-Kenntnisse, www.w3.org/TR/json-ld11).
Als unabhängiges, direkt in HTML einbindbares Mikrodaten-Format startete 2005 Microformats vor dem Hintergrund einer Blog-Suchmaschine. Da sich der Suchmaschinenbetreiber ab 2014 auf eine Google AdSense ähnliche Werbeplattform konzentrierte und Microformats nicht von Googles Schema.org unterstützt wird, geht die Bedeutung des Formats seit Jahren zurück (microformats.org, hier ein Vergleich über das Können der Formate von einem W3C-Mitglied: http://manu.sporny.org/2011/uber-comparison-rdfa-md-uf).
Für eine Ranking-fördernde Auszeichnung stellt sich damit zunächst folgende Frage.
Welche Mikrodaten/Mikroformate akzeptiert Google?
Auf der Developer-Seite „So funktionieren strukturierte Daten“ (developers.google.com/search/docs/guides/intro-structured-data?hl=de) äußert sich Google wie folgt:
Google erkennt bei der Google Suche strukturierte Daten in folgenden Formaten: JSON-LD (empfohlen), Microdaten und RDFa. Google empfiehlt ausdrücklich, für strukturierte Daten (nach Möglichkeit) JSON-LD zu verwenden; als Beispiel wird ein Snippet mit JSON-LD-Daten in schema.org-Struktur vorgestellt.
Für eine ganze Reihe von Auszeichnungen stellt Google hier: https://developers.google.com/search/docs/guides/search-gallery?hl=de fertige Funktionen bereit. Hier: https://developers.google.com/search/docs/guides/prototype?hl=de wird erklärt, wie die strukturierten Daten in neue und bestehende Seiten eingebunden werden.
Allerdings erfolgt die Unterstützung der genannten Formate nur, „sofern nichts anderes angegeben wird“. Weiter unten wird geraten, auch die Richtlinien für den jeweiligen speziellen Typ strukturierter Daten zu beachten – weil Google zwar JSON-LD empfiehlt, aber nicht rundum unterstützt.
Diese Empfehlung zur Verwendung von JSON-LD ist insofern verständlich, dass hier ein wenig RDFa eingebunden wird. RDFa unterstützt einen höheren Grad an Internationalisierung und erlaubt eine sehr viel genauere semantische Markierung als das Microdata-Format (das keine „HTML-Spezifikation einer offenen Community“ ist, wie Google hier angibt, sondern eine HTML-Spezifikation der WHATWG mit Google und Co.).
Wenn Ihre Seite von einer sehr spezifischen Auszeichnung profitiert, wäre es dann eventuell logischer, gleich RDFa zu verwenden (das auch in schema.org eingebunden werden kann). Das wird in Google Anleitung für die Erstellung einer neue Seiten mit strukturierten Daten und im Testtool für Rich-Suchergebnisse nur nicht erwähnt …
Wenn Sie mit strukturiertem Daten das „semantische Netz“ und einen Spitzenplatz im Ranking erobern wollen, sollten Sie sich also entweder sehr gründlich ins Thema einarbeiten oder Ihre Online-Marketing Agentur fragen (für Menschen, die nicht ständig mit solchen Formaten zu tun haben, vermutlich immer besser, weil Google Vorlieben für bestimmte Mikroformate in bestimmten Anwendungen durchaus öfter mal wechseln können).
Bedeutung der Mikroformate für das Ranking
Die Frage ist nur, wie sehr die Strukturierung der Daten dabei hilft, einen Ranking-Spitzenplatz zu erobern … Das Unternehmen des SEO-Experten Brian Dean hat passend dazu gerade 11,8 Millionen Google-Suchergebnisse analysiert, um die aktuell im Vordergrund stehenden Rankingfaktoren herauszuarbeiten.
Das Ergebnis zeigte, dass Backlinks (Verweise auf die eigene Seite) nach wie vor eine hohe Relevanz für das Ranking haben. Das Nr.-1-Suchergebnis hatte durchschnittlich 3,8 Mal mehr Backlinks als die Seiten auf Position 2 bis 10 (und die folgenden), und diese Backlinks kamen von ganz unterschiedlichen Seiten.
Dabei zeigte sich erfreulicherweise, dass gut vernetzte kleinere Seiten genauso gute Chancen auf ein gutes Ranking haben wie die Marktführer der jeweiligen Branchen, weil Bewertungen nach Qualität der Links (Links von gut besuchten, großen Seiten) keinerlei Korrelation mit dem Ranking zeigten. Unterstützt wird das durch den Befund, dass kleine, leichte Seiten gleich gute Chancen auf ein Spitzenranking haben wie kostenintensive „Schwergewichte“.
Die Analyse gibt weiter entscheidende Hinweise darauf, wie die Seiten in den Spitzenpositionen zu ihren Ranking-fördernden Backlinks kamen: Sie behandelten ihre Themen alle sehr umfassend, in einer für den Nutzer interessanten und gut verständlichen Art und Weise. Die durchschnittliche Wortzahl auf den „Sieger-Seiten“ an Suchergebnis-Position Nr. 1 betrug 1.447 Wörter. Das wiederum führte zu einer überdurchschnittlich langen Verweildauer auf diesen Seiten, die das Ranking sehr fördert (die Analyse errechnete: 3 Sekunden mehr „time on site“ = Aufstieg um eine Ranking-Position).
Zu den Faktoren, für die keine Ranking-Relevanz ausgemacht werden konnte, gehört z. B. die Ladegeschwindigkeit der Seite (aber Vorsicht, es ging um das Ranking auf der ersten Seite; wer seine Besucher mit langen Google-Analysen und langsam ladenden Werbe-Einblendungen foltert, schießt sich lange vorher aus dem Rennen). Auch Keywords (im Titel-Tag, als Verweis auf Keywords im Text) korrelierten nicht mit besseren Rankingplätzen – und die Daten zeigten weiter, dass die Markierung mit Googles Schema-Markup nicht mit höheren Rankings korreliert.
Dann kann nach der oben erläuterten Logik (die auch deshalb so ausführlich geschildert wurde) auch eine noch präzisere Markierung innerhalb von Schema keine sehr hohe Relevanz fürs Ranking haben; erlangt allenfalls Bedeutung zur Betonung eines nutzerrelevanten Contents, der zu hoher Vernetzung führt. Wie sich eine sauber unter voller Ausnutzung des RDFa-Repertoires implementierte Betonung eines hochqualitativen Contents direkt im HTML einer Seite auswirkt, muss erst noch untersucht werden – bisher sind weniger als die Hälfte der Webseiten überhaupt irgendwie semantisch markiert.
Die Praxis: Wann Mikrodaten einbinden?
Sprechen Sie mit Ihrer Online-Marketing Agentur, und bitten Sie sie, Ihnen offen und ehrlich Auskunft über die Suchmaschinenfreundlichkeit ihrer Seiten zu geben:
Ist der Inhalt wirklich nutzerfreundlich, oder werden die Nutzer mit langen Ausführungen z. B. zu einem Produkt gelangweilt, von denen er lieber nur wenige, relevante Punkte erfahren würde?
Erfahren die Nutzer etwas über die Zusammenhänge ihrer Leistung, über die Auswirkungen auf die Umwelt, über gesellschaftliches Engagement Ihres Unternehmens?
Wurde der Text von Menschen geschrieben, die mit Schriftsprache umgehen können (denen genug Zeit zum Verfassen der Texte zur Verfügung stand, die nicht durch unsinnige Vorgaben behindert wurden)?
Erst wenn die Nutzerfreundlichkeit der Inhalte stimmt, haben Sie überhaupt Chancen auf gutes Ranking. Erst dann sollten Sie mit Ihrer Online-Marketing Agentur beraten, welche Inhalte sich für aufmerksamkeitsheischende Markierung als Rich Snippets eignen, welche Inhalte darüber hinaus markiert werden sollten, welche Inhalte speziell für kaum genutzte Markierungsmöglichkeiten als „Sahnehäubchen“ generiert werden könnten …
Bei Fragen oder Interesse nehmen Sie bitte einfach Kontakt zu uns auf.
SEO Deutschland – Die kreative SEO Agentur