Wirklich wahres Wingmen SEO Wissen für wache Webmarketer #276
Wingmen Online Marketing GmbH Logo
Lara Hornung
Lara Hornung
Werkstudentin
💌 SEO mit Herz & Hochzeit

Ich liebe Hochzeiten! 💍 Egal ob aus dem Takt geratene Tanzschritte, kleine Katastrophen beim Buffet oder Onkel-Klaus, der viel zu früh die Karaoke-Anlage entdeckt, irgendwas macht sie immer unvergesslich. Am Samstag durfte ich bei der Hochzeit meiner Cousine dabei sein. Das Wetter hat zwar sein Bestes gegeben, uns die Frisuren zu ruinieren, aber schön war’s trotzdem und am Ende zählt ja sowieso nur die Liebe (und vielleicht noch das Dessertbuffet).

Fast so bunt wie eine Hochzeitsfeier ist auch diese Newsletter-Ausgabe. Hier kommen die Beiträge der Woche:

  • Funkelnder Florian Hannemann, der AI-Visibility mit so viel Charme serviert, als wär's ein Hochzeitstörtchen
  • Charmante Cleo, die mit Query Fan Out den Brautstrauß der Suchanfragen wirft
  • Feiernder Flo, der das SIXT SEO-Wiesn-Recap wie einen Hochzeitsstrauß bündelt
  • Jubelnder Johan, der die Cloudflare-Robots.txt vor den Altar zerrt
  • Mutiger Matt, der Dir zeigt, warum Shopify-Crawling jetzt im Hardmode getanzt werden muss

Also, Sektgläser hoch und viel Spaß beim Lesen und Mitfeiern! 🥂

Deine Wingmenschen

Was wir gelesen haben
Florian Hannemann
Florian Hannemann
Junior Consultant
Schema oder Schmu? – Wie viel Structured Data steckt in AI-Visibility?

Fast jeder will heutzutage in der AI-Welt stattfinden und vielleicht fragst auch Du Dich, wie Deine Inhalte in LLMs und AI-Overviews sichtbar werden können. Je nachdem, wen man fragt, bekommt man sehr unterschiedliche Antworten dazu, wie man am besten Mentions und Citations bekommt. Viele dieser Empfehlungen sind jedoch schwer belegbar oder umstritten.

Ein besonders diskutierter Punkt ist dabei Structured Data. Während es für SEOs seit Jahren ein fester Bestandteil der Arbeit ist, ist der Nutzen im Zusammenhang mit AI-Visibility bisher eher ungewiss. Um mehr Klarheit zu schaffen, habe ich mich durch den Dschungel der aktuellen Studien zu dem Thema geschlagen und Dir ein paar Erkenntnisse mitgebracht.

In diesem Test auf Search Engine Land wurden 3 inhaltlich nahezu identische Seiten erstellt. Diese wurden dann unterschiedlich mit Schema-MarkUp ausgestattet:

  • 1 Seite blieb ohne Schema
  • 1 Seite erhielt mangelhaftes Schema
  • Und 1 Seite erhielt vollwertiges Schema

und ins Ranking geworfen.

Nur die Seite, die mit gutem Schema ausgestattet wurde, tauchte zum Thema in AIOs auf und erzielte auch die besten Rankings. Die Seite mit mangelhaftem Schema tauchte zwar nicht in AIOs auf, erzielte aber ebenfalls Rankings. Nur die Seite gänzlich ohne Schema wurde von Google nicht mal indexiert.

Obwohl es zwar ein Vorteil ist, dass dieser Test Seiten mit wirklich ähnlichen Inhalten und Grundvoraussetzungen erstellt hat, ist das Ergebnis dennoch wenig aussagekräftig. Da es sich nur um 3 Seiten handelt, ist die Datenbasis so gering, dass sich daraus keine fundierte Erkenntnis ziehen lässt.

Deutlich tiefer geht die Studie von Arlen Kumar und Leanid Palkhouski (UC Berkeley / Wrodium Research). Sie entwickelten das GEO-16 Framework, das 16 On-Page-Signale, wie Metadaten, Freshness, semantisches HTML und strukturierte Daten systematisch misst und mit den Zitationsentscheidungen von AI-Modellen abgleicht.

Getestet wurden 70 B2B-SaaS-Prompts in Brave, Google AI Overviews und Perplexity. Dabei wurden 1.702 Citations und 1.100 URLs analysiert.

Das Ergebnis?: Die wichtigsten Signale für Zitationen sind laut der Studie

  1. Metadaten & Freshness
  2. Semantisches HTML
  3. Structured Data

Structured Data korreliert mit einer um 39% höheren Wahrscheinlichkeit zitiert zu werden. Das heißt, Seiten mit validem Structured Data werden deutlich häufiger als Quelle ausgewählt. Laut Studie ist dieser Zusammenhang sogar etwas stärker als bei Evidence & Citations (+37%).

Das Ergebnis klingt also vielversprechend für Structured Data und die Datenmenge ist auch mehr, als wir sonst von anderen SEO-Studien gewöhnt sind. Trotzdem handelt es sich lediglich um eine Korrelation. Wir wissen also nur, dass die beiden Faktoren gemeinsam auftreten, aber nicht sicher, ob Structured Data der eigentliche Auslöser ist oder nur mit anderen Qualitätsmerkmalen zusammenfällt.

Dass Structured Data in so einem Zusammenhang mit Zitierungen auftrat, mag auch daran liegen, dass diese Seiten besser SEO optimiert sind. AI Overviews haben schließlich eine hohe Schnittmenge mit den Top Ergebnissen auf der SERP. Da in der Studie zudem die Qualität der Structured Data selbst bewertet wurde, liegt die Vermutung nahe, dass es sich hier um generell optimierte und technisch saubere Seiten handelt, die gleichzeitig von der Engine bevorzugt werden.

Während die Studie zwar schon wesentlich tiefer geht als die Erste, kann man sich nicht alleine darauf verlassen.

Mark Williams Cook zum Beispiel spricht sich klar gegen die Effektivität von Structured Data für AI aus. Er sagt, dass LLMs beispielsweise gar kein Schema nutzen. Seine Argumente:

  • LLMs sind darauf trainiert, menschliche Inhalte zu verstehen. Strukturierte Hilfsmittel wie Schema.org widersprechen diesem Ziel, weil sie maschinelle statt natürliche Lesbarkeit fördern
  • Der Tokenization Prozess macht das Schema unbrauchbar, da die Tokenization die strukturierten Angaben auseinanderreißt. So geht der semantische Zusammenhang verloren
  • Da LLMs jeweils das nächste Token vorhersagen, bringen strukturierte Daten keinen echten Mehrwert für das Verständnis
  • Höchstwahrscheinlich wird Schema im Pre-Training sowieso verworfen, da der Fokus von LLMs darauf liegt nur für Menschen lesbare Inhalte zu bewerten und zu verstehen

Trotz seiner Skepsis gegenüber der direkten Wirkung auf LLMs spricht sich Williams-Cook nicht grundsätzlich gegen Structured Data aus. Er betont, dass strukturierte Daten weiterhin eine wichtige Rolle für Suchsysteme spielen und im Kontext von RAG (Retrieval-Augmented Generation) einen Nutzen haben können. Auch für ein besseres Ranking in Fastsearch kann Structured Data theoretisch helfen, mehr Zitations zu erzielen (mehr dazu in Cleos Artikel zur Sichtbarkeit von Webseiten in KI-Modellen).

Was heißt das also am Ende?

Es gibt bislang keine klaren Belege, dass Structured Data einen direkten Einfluss auf die AI-Visibility hat. Besonders für die Sichtbarkeit in LLMs ist ein Effekt schwer nachzuweisen und eher unwahrscheinlich. Für das Auftauchen in AI Overviews besteht allerdings wenigstens eine deutliche Korrelation.

Falls Du gerade auf den AI-Zug aufspringen willst und überlegst, ob Du Structured Data implementieren oder optimieren solltest, bedenke folgende Punkte:

  • Structured Data integrieren ist kein großer Aufwand und schadet nicht
  • LLMs könnten im RAG Prozess durchaus darauf zugreifen
  • Structured Data bringt Dir viele Vorteile außerhalb von AI-Citations. Es hilft Dir auf alle Fälle von Google und anderen Suchsystemen besser verstanden zu werden und ein besseres Ranking kann Dir indirekt auch bessere AI-Visibility bringen.
Cleo Lauterbach
Cleo Lauterbach
Junior Consultant
Herbstliches Query Fan Out

Es herbstet, es ist kalt geworden. Draußen liegen Kastanien auf den Wegen und ich sitze wie ein Burrito in eine Decke eingerollt auf meinem Bürostuhl. Mit meinen eisigen Fingern google ich: “Was tun gegen kalte Hände im Herbst?” und erhoffe mir eine passende, hilfreiche und umfangreiche Antwort.

Google möchte mir diese auch liefern und setzt jetzt das Prinzip des Query Fan Out ein.

Query Fan Out ist die Technik, eine komplexe Nutzeranfrage in mehrere spezialisierte Unteranfragen aufzufächern. Diese laufen parallel in Suchindizes, Wissensdatenbanken oder über KI-Systeme. Am Ende werden die Ergebnisse zusammengeführt, gefiltert und in eine nutzerfreundliche Antwort gegossen.

Aus meiner einen großen Frage entstehen im Hintergrund bei Google also viele kleine Unterfragen, zum Beispiel:

  • “Wie hilft ein Handbad mit warmem Wasser gegen kalte Hände?“
  • “Einfache Übungen gegen kalte Hände am Schreibtisch“
  • “Wechselduschen Wirkung auf Kreislauf und Hände“
  • “Lebensmittel, die die Durchblutung verbessern“
  • “Welche Gewürze regen die Durchblutung an?“

Googles AIO Antwort zur Frage "Was tun gegen kalte Hände im Herbst?"

Danke Google. Ich erhalte durch dieses Prinzip umfassende Antworten, ohne selbst alle Teilfragen einzeln stellen zu müssen. Die Technik antizipiert auch implizite Fragen und liefert relevante Aspekte, die ich vielleicht noch nicht bedacht oder formuliert habe.

Was bedeutet das für Deinen Content?

Inhalte bedienen im besten Fall nicht nur ein einziges, engmaschiges Keyword. Klassisches Keyword-Targeting verliert etwas an Bedeutung, relevanter wird es hingegen, Inhalte zu liefern, die thematisch breit und inhaltlich tief aufgestellt sind. Also eine Themenlandschaft um dieses Keyword herum darzustellen (Fragen beantworten, Anwendungsfälle darstellen, Differenzierungen und Vergleiche ziehen). Nutze hierfür Fachbegriffe, Synonyme, thematische Verknüpfungen und klare Definitionen. Schaffe Tiefe und decke verschiedene Blickwinkel ab! Inhalte, die wie ein thematisches Ökosystem gebaut sind, können im Fan-Out-Prozess mehrfach angedockt werden.

Auch Zitate, Quellenangaben und transparente Fakten sind ein Vorteil, denn sie erhöhen die Chance, dass Deine Inhalte von AIOs als zitierwürdig erkannt und in den Antworten eines Query Fan-Out berücksichtigt werden. Je vertrauensvoller (denk an E-E-A-T) und strukturierter Deine Inhalte sind, desto eher werden sie als Baustein für die Unteranfragen ausgewählt.

Ich gehe mir jetzt eine Wärmflasche machen…

Florian Stelzner
Florian Stelzner
Geschäftsführender Gesellschafter
🥨 SIXT SEO Wiesn Recap 🍺

Am Mittwoch war es wieder so weit, die SIXT SEO Wiesn luden zum Oktoberfest nach München ein. Oder, wie Alex B. Ryte N Bach es treffender nicht singen kann: "Schädelweh, Schädelweh, morgen ham wir Schädelweh. Schädelweh, Schädelweh, Schädelweh is schee…"

Schädelweh singt man hier nicht nur zweimal, weil es der Liedtext so vorgibt, sondern weil vor dem Feiern im Getöse des Schützenfestzeltes noch eine Druckbetankung an SEO-Wissen in der SIXT-Zentrale in Pullach stattfindet.

Dieses Jahr endete das Ganze mit einer Diskussionsrunde zu aktuellen Themen, die vorher in kurzer Gruppenarbeit erarbeitet wurden. Und die Gruppen hatten es in sich: SEO-Expert*innen mit jahrelanger Erfahrung aus den unterschiedlichsten Branchen waren vertreten.

Zu den Vorträgen

Andor Palau eröffnete die Vortragsreihe mit seinem Take zu Crawling, Indexing and Log File Analysis und betonte, wie wichtig es ist, sich tiefgehend und regelmäßig mit der eigenen Infrastruktur auseinanderzusetzen. Gerade in Zeiten steigender Zugriffszahlen durch ChatBots, die das Thema Bandbreitennutzung und Serverkosten wieder auf den Plan rufen. Sauberes Monitoring und vor allem Caching sind dabei immanent wichtig.

Gus Pelogia, dem ich zunächst zu dem schmerzlichen Verlust seines Luftballon-Schweins Oinc kondolieren möchte, zeigte spannende Use Cases für den Einsatz von Vector-Embeddings in unterschiedlichsten Szenarien. Mittels Colab-Notebook und KI-gestütztem Python-Coding war es einmal mehr ein Aufruf an alle SEOs: Beschäftigt euch näher mit Programmierung! Baut eure eigenen Tools, statt den LinkedIn-Trollen mit ihren albernen N8N-Workflows hinterherzujagen. Besonders spannend fand ich den Gedanken, sich nicht nur beim Thema Verlinkung mit Embeddings zu beschäftigen, sondern auch die Content-Ähnlichkeit der eigenen Inhalte gegenüber dem Wettbewerb zu analysieren.

Lars Weber zeigte den Anwesenden schmerzlich, wie einfach es sein kann, gehackt oder mit tonnenweise negativen Signalen überschüttet zu werden. Hier lässt sich wunderbar der Bogen zu Andor spannen: Leute, monitored eure Seiten besser und setzt auf einen Hoster, dem ihr vertraut! Eure Seite wird „irgendwie“ immer langsamer und langsamer über einen langen Zeitraum… You better watch out, you better watch out… Mister Spammy is coming around! Für diesen gratis Ohrwurm nehme ich dankend eure virtuellen Küsschen an.

Max Muhr präsentierte seine SEO-Stickereien in einer großartigen Präsentation mit spannenden Insights zu E-E-A-T & Entity Optimization. Allein schon seine Selbstvorstellung nach dem E-E-A-T-Muster war weltklasse und wird dreist von mir geklaut. Aber halb so wild… Max habe ich bereits zugesichert, dass er einige seiner Ideen in den kommenden Wochen als kleinen Showcase für sein Tool Polisys am offenen Herzen von uns Wingmenschen ausprobieren darf. We'll keep you posted. Wer den Vortrag in abgewandelter Form noch einmal genießen möchte, hat auf der SEOcruise Gelegenheit dazu. Es gibt wohl noch Tickets, und tatsächlich überlege ich, meine CO₂-Concerns allein dafür schon zur Seite zu legen. Max hat mir zudem versichert, dass es keine klassische Kreuzfahrt ist, sondern ein Fährbetrieb, der sogar zur Reduktion von CO₂ beiträgt, weil LKWs von Kiel nach Oslo nicht über die umständliche Landstrecke fahren müssen. Kann das bitte mal jemand für mich ausrechnen?

Emilia Gjorgjevska beendete die Vorträge mit einem großartigen Finale, das mich gedanklich noch immer nicht loslässt. Mit der ketzerischen Frage: „Wer hat sich schon mal nicht ganz sicher gefühlt, als er eine interne Verlinkungsmaßnahme berechnet hat?“ gingen erschreckend viele Hände nach oben. Emilia zeigte erste Ergebnisse ihrer wissenschaftlichen Arbeit rund um ihre Master-Thesis, die sie mit dem Open-Source-Tool WebKnoGraph erstellt hat. Neben der Simulation der Pagerank-Veränderung, die Johan bereits mehrfach auf SEO-Bühnen vorgestellt hat, ist hier besonders bemerkenswert, dass der Pagerank nicht nur für die eigene Seite, sondern über einen gesamten Web-Korpus berechnet wird. Mal ehrlich: Das ist richtig geiler Scheiß!

Ab auf die Wiesn

Nach der bereits erwähnten Diskussionsrunde ging es dann mit dem Bus zur Wiesn. Es soll da angeblich Bier getrunken worden sein. Auch wurden tanzende Menschen auf Tischen und Bänken gesichtet. Schee war’s!

Danke SIXT! Ti amo!

Johan von Hülsen
Johan von Hülsen
Geschäftsführender Gesellschafter
Standaaaaarts für robots.txt-Rabulistik

Wir mögen Cloudflare.

Aber aktuell geht die politische Positionierung im AI-Thema leider zu Lasten meiner Markenwahrnehmung.

Ein Herz für Cloudflare

Cloudflare bietet einen CDN-Service an. Das Tolle daran ist, dass man dabei auch mal in den Antworten rumfummeln kann. Über Cloudflare Redirects einrichten, Seitenbereiche schnell auf Noindex setzen, das alles und noch viel meeeehr kann man mit Cloudflare machen.

Cloudflare ist aber auch als Ritter gegen die bösen AI-Crawler unterwegs.

Schon beim automatischen Blocken von AI Bots (inklusive Google) fand ich es enorm schwierig, dass das bei neuen Konten direkt aktiviert wird.

Kommt, wir machen unseren eigenen Standard!

Jetzt hat Cloudflare aber einen eigenen Standard in viele robots.txt geschrieben. Sie haben quasi einen neuen robots.txt-Dialekt entwickelt. Und diesen Dialekt auf Kunden mit aktiviertem Bot-Blocking ausgerollt.

Wenn Du Cloudflares Bot-Management aktiviert hast, dann wird jetzt in der robots.txt rumgewerkelt. Ohne Rücksprache mit Dir. Das finde ich schwierig.

Noch schlimmer aber ist, dass Cloudflare gleichzeitig erzählt, dass Google möglicherweise Strafe zahlen muss, wenn sie sich nicht daran halten. Was für ein Unsinn.

Das Schlimme ist, dass das Playbook klar ist:

  • Cloudflare verspricht das den Kunden
  • Installiert das in 1.000enden robots.txt
  • Wird dann in ein paar Wochen von der überwältigenden Adoption Rate berichten
  • Um Google schlecht aussehen zu lassen.

Das ist genauso durchschaubar wie falsch.

Die robots.txt ist ein Webstandard. Für die Weiterentwicklung dieses Standards gibt es entsprechende Gremien. Dort sollten Standards verhandelt werden.

Wie wollen wir denn Standards im Internet durchsetzen, wenn jeder seinen eigenen baut, nur, um irgendwelche Machtspielchen zu spielen.

Hier geht es nur um eigene Positionierung. Auf dem Rücken der eigenen Kunden.

Der Angriff gegen Google ist außerdem grundfalsch. Google hat die granularsten Möglichkeiten zur Bot-Steuerung von allen Akteuren auf dem Markt. Mit Data-Nosnippet kann man sogar einzelne Worte von der Nutzung ausschließen.

Und das gewählte Mittel ist auch das Falsche. Die robots.txt ist für eine Einzelsteuerung nicht geeignet. Natürlich kann ich pauschal alles sperren. Aber wenn ich nur die Artikel ab 2025 sperren möchte, oder nur die von Werner, die von Marianne nicht, dann funktioniert die robots.txt nicht. Genau deswegen sind Index-Steuerung und Crawl-Steuerung aus guten Gründen an unterschiedlichen Stellen geregelt.

Sich jetzt hinzustellen, die Kunden zu belügen (weil Google die Angaben zurecht ignoriert) ein konzeptionell schlechteres Mittel ins Rennen zu schicken und dann mit dem Finger zu zeigen funktioniert auch nur, weil Cloudflare konsequent die Steuerungsmöglichkeiten ignoriert hat.

Ich hab mich ja auch schon beruhigt. Mit etwas zeitlichem Abstand bezeichne ich das schon gar nicht mehr als Arroganz (denke aber weiter, dass es welche ist).

Matthias Pülz
Matthias Pülz
Junior Consultant
Shopify-Crawling nun im Hardmode verfügbar

Oh weh, oh je… Vielleicht ist es Dir bereits aufgefallen oder Du hast es irgendwo gelesen, aber neuerdings wird es schwerer, Shopify-Seiten mit Screaming Frog, Sitebulb & Co. zu crawlen. Grund dafür sind Änderungen bei der Google-Authentifizierung. Und die sorgen dafür, dass besagte Tools reihenweise gegen die Wand laufen.

Also nicht wundern, wenn Du gerade beim Crawling (D)eines Shopify-Shops verzweifelst oder Dich fragst, wieso der Crawl-Output so verdächtig falsch oder unvollständig wirkt.

Zum Glück gibt es aber auch schon einen passenden Workaround, den Chris Lever in seinem Blog veröffentlicht hat. Sehr anschaulich und verständlich beschrieben, nur leider etwas zu lang, um ihn hier im Newsletter voll aufzugreifen.

Mein Take zu dem Thema: Es wirkt zuletzt fast so, als hätte Google Spaß daran, uns SEOs kleine Stolpersteine in den Weg zu legen. Erst die AI Overviews, dann die num-Parameter-Thematik und nun das! Na gut.

Umso schöner, dass für sämtliche “Probleme” auch schnell eine Lösung gefunden wird oder bereits existiert. Und sicher auch schon einmal ein gutes Training für die Zukunft. Denn eines ist sicher: Da werden noch weitere Änderungen auf uns SEOs zukommen. Was genau genommen ja schon immer Teil der Suchmaschinenoptimierung war – nur vielleicht nicht in dieser Stärke oder Geschwindigkeit.

Vorherige AusgabeNächste Ausgabe
 
Fragen? Immer gerne fragen!
Wir sind für Dich da.
Schreib uns gern jederzeit
eine E-Mail an [email protected] oder
ruf uns einfach kurz an: +49 40 22868040

Bis bald,
Deine Wingmenschen
Anckelmannsplatz 1, 20537 Hamburg, Germany
Wingmen Online Marketing GmbH Logo