Wirklich wahres Wingmen SEO Wissen für wache Webmarketer #149 |
|
🥳 404-Newsletter not found |
Der amerikanische 404-Day ist ein Feiertag, der auf die Zensur im Internet aufmerksam machen soll. In diesem Sinne: Happy 404-Day! Wir wünschen Dir ein informatives und zensurfreies Internet. 🎉
Damit das Internet und die Suchmaschinenoptimierung für Dich eine Quelle der Freude und des Wissens ist, haben wir diese Woche folgende spannenden Themen unzensiert für Dich:
Behrend berichtet: ChatGPT bekommt keine italienische Aufenthaltsbewilligung
Matt macht sich auf die Suche nach Brands in den Snippets
Johan binged Bing begeistert
Jolle jongliert mit "unavailable_after"-Tag
Nora nähert sich der facettierten Navigation
Viel Spaß beim Lesen ❣️
Deine beflügelten Flügelmenschen
|
|
ChatGPT, quo vadis! |
Ja ChatGPT, wohin gehst Du? Erstmal nicht nach Italien, egal wie viele Wege nach Rom führen... Die Italienische Datenschutzbehörde hat ChatGPT offiziell ausgesperrt und begründet das mit der Verarbeitung personenbezogener Daten in den Trainingsdatensätzen des Large Language Models (LLMs).
Schauen wir also gen Italien, denn das war kein Aprilscherz, sondern der volle Ernst. OpenAI hat entsprechend italienische Konten bis auf weiteres gesperrt. Ob weitere europäische Datenschutzbehörden der "Garante" folgen und ob das auch für Bing Chat Service oder gar Bard und Co. ausgeweitet wird, ist noch nicht klar. Beides wäre aber folgerichtig, wenn man sich die Begründung anschaut.
Was wird an ChatGPT konkret bemängelt?
Es fehlt die rechtliche Grundlage für das massive Verarbeiten der personenbezogenen Daten
Die Verarbeitung der Daten ist ungenau
Kinder werden nicht ausreichend vor nicht altersgerechten Inhalten geschützt
Ob und wie OpenAI eine Altersverifikation vornimmt, habe ich bislang tatsächlich nicht beachtet. Aber der Versuch, eine altersgerechte KI bereitzustellen, wurde, soweit ich weiß, noch nicht unternommen, und wenn, wäre es wohl ein sprichwörtliches Kinderspiel, der KI unangebrachte Äußerungen zu entlocken.
Die anderen Punkte finde ich aber interessanter. Alle LLMs benötigen Trainingsdaten wie z.B. den CommonCrawl-Datensatz. Diese Trainingsdaten sind aus dem Internet gescraped und enthalten ohne Zweifel Daten, die als personenbezogen definiert werden könnten. Frag so einen ChatBot doch einfach mal über Dich aus.
Daraus ergeben sich einige moralisch-ethische und natürlich auch rechtliche Fragestellungen
Hat OpenAI personenenbezogene Daten verarbeitet? Oder commoncrawl? Oder beide?
Haben sie das absichtlich gemacht?
Ist eine Einwilligung notwendig, wenn Daten von uns selbst veröffentlicht wurden? Z.B. auf unserer Teamseite?
Die Idee, einfach das Internet zu scrapen, um an einen passenden Datensatz zu kommen, ist für Suchmaschinen das normale Vorgehen. Wenn die Daten im Trainingsdatensatz das Problem sind, dann wäre auch Googles Suchindex ein Datenschutzproblem und müsste genauso behandelt werden.
Insofern ist eher die Verarbeitung in einem Sprachmodell das Problem, dass Informationen wiedergeben kann, ohne dabei den direkten Quellbezug herzustellen, wie es Suchmaschinen tun, wenn Sie uns Suchergebnisse anzeigen (und auch das haben Verlage schon urheberrechtlich kritisch gesehen, Stichwort "Leistungsschutzrecht").
Um rechtlich auf der sicheren Seite zu sein, müssten die personenbezogenen Daten aus den Datensätzen gefiltert werden. Das ist aber technisch kaum machbar.
Was wollen wir als globale Gesellschaft?
Was passiert, wenn die Daten verarbeitet werden, dabei aber fehlerhafte Ergebnisse rauskommen?
ChatGPT behauptet, dass ich aus Berlin komme. Wenn ChatGPT einen falschen Wohnort von mir halluziniert, ist das dann überhaupt personenbezogen?
Habe ich ein Recht darauf, das ich korrekt wiedergegeben werde?
Diese Fragen sind aus meiner Sicht alle nicht schlüssig beantwortet und das müssen wir als Gesellschaft klären. Da es um Dinge im Internet geht, wird das global geschehen müssen... Was hilft es, ChatGPT in Italien zu verbieten, wenn die Daten über Italiener in Amerika fleißig weiter verarbeitet werden?
Und was auch immer am Ende der Konsens ist, es wird sicher technische und rechtliche Mittel benötigen, dass dieser Konsens auch eingehalten wird. Da wird ein halbes Jahr Moratorium nicht viel ausrichten. Das ist eine Mammutaufgabe, die von der Zivilgesellschaft (das sind Du und ich und wir) begleitet und diskutiert werden muss. Wir wollen schließlich, dass die Chancen und Gefahren, die künstliche Intelligenz bietet, zu unseren Gunsten bestmöglich abgewogen werden.
|
|
Ey Mann, wo is’ meine Brand? |
Es ist Dir sicher längst aufgefallen, wenn Du in letzter Zeit einmal einen genaueren Blick auf die Suchergebnisseite von Google geworfen hast:
Die Marken, die sonst so einheitlich am Ende der meisten Titles standen, sind in den organischen Ergebnissen plötzlich weitestgehend verschwunden. Kaum mehr eine Brand zu finden und die abtrennende Pipe | oder der Spiegelstrich - davor sind auch gleich mit verschwunden.
So wird aus "Weiße Sneaker online kaufen | BRAND" plötzlich nur noch "Weiße Sneaker online kaufen" oder wie bei unserem Wissensartikel über XML-Sitemaps:
Der Blick in das HTML zeigt, dass hier alles beim Alten ist: Pipe da, Brand da. Nur in der SERP eben nicht.
<title>Die XML-Sitemap - alles was Du wissen musst | Wingmen Online Marketing</title>
Also bleibt wieder einmal nur der Bösewicht Google, der etwas an den Suchergebnisseiten herumgeschraubt hat.
Gut möglich, dass der Wegfall der Brand mit der neuen Darstellung des Seitennamen in der SERP zusammenhängt, über die ich in unserer Newsletter-Ausgabe 3 Paletten SEO-Schmerz für die SMX schon einmal berichtet habe.
In der Kurzfassung: Der Markenname wird seit Kurzem sowohl auf mobilen Endgeräten als auch bei der Desktop-Suche oberhalb der URL (mit Favicon) angezeigt, wodurch die Nennung der Brand im Title natürlich an Relevanz verliert.
Stellt sich nun natürlich die Frage, wie Du mit den Änderungen umgehst. Da gibt es im Wesentlichen drei Möglichkeiten:
Brand im Title umformulieren:
Einmal kannst Du natürlich versuchen, Deinen Markennamen so anzupassen, dass er trotzdem wieder angezeigt wird. So wird aus Wingmen Online Marketing vielleicht einfach WingmenOnlineMarketing oder gar W-I-N-G-M-E-N OM? Könnte funktionieren, aber willst Du das wirklich?
Vorhandenen Platz anderweitig nutzen:
Wenn die Brand ohnehin wegfällt: Wieso solltest Du den neu gewonnenen Platz im Title nicht anderweitig nutzen. Vielleicht wolltest Du schon immer einmal ausprobieren, wie ein Call To Action im Title performt. Jetzt hast du die Chance dazu, denn wenn nicht jetzt, wann dann?
Auf die Rückkehr warten:
Ansonsten kannst Du Dich natürlich auch für die dritte Möglichkeit entscheiden: Warten, Tee trinken und auf die Rückkehr der Brand hoffen. Denn wer weiß? Vielleicht ist sie ja wirklich nur kurz Zigaretten holen gegangen.
Wir sind auf alle Fälle gespannt, wie es mit dieser Änderung weitergeht und ob sie überhaupt bleibt.
|
|
I binged it |
Hurra! Ich hatte das erste Mal als User den Case, dass ich dachte, der Chatbot könnte mir eher helfen, als die Google-Suche. Bisher habe ich zwar viel experimentiert, aber immer als SEO und ohne konkreten Use-Case für mein Leben.
Jetzt war es so weit und ich gebe 3 von 5 Sternen auf der „unmotivierte Service-Kraft"-Skala.
Das Setting
Was war passiert? Mein alter Brother DPC9015CDW Laserdrucker hat sich mit Fehler 02: Gerät ausschalten und anschließend wieder einschalten für den Eintritt in seinen letzten Lebenszyklus qualifiziert: Recycling!
Ein neuer Drucker muss her. Aber die Patronen sind noch halb voll und teilweise habe ich noch komplett volle Reservepatronen. Also möchte ich einen Drucker kaufen, um die Patronen weiterzuverwenden. (Ob das geizig oder nachhaltig ist, überlasse ich Deiner Interpretation). Da der Drucker 7 Jahre alt ist, kommt eine einfache Ersatzbeschaffung eigentlich nicht infrage.
Die Ausgangsfrage (2/5)
Ich habe Bing also gefragt:
Welche aktuellen Druckermodelle nutzen die Patronen Brother TN241 TN245 TN242 TN246
Bing hat erstmal nach Druckermodelle Brother TN241 TN245 TN242 TN246 gesucht. Nicht so richtig genialer Ausgangspunkt. Außerdem ist das ständige Suchen von Bing sowieso irritierend. Und werden die Suchen des Bing Chat eigentlich in die Suchvolumina-Statistik gezählt? Ich schweife ab...
Auf der Basis antwortet Bing:
Die Antwort stammt aus den Web-Suchergebnissen. Die Patronen Brother TN241 TN245 TN242 TN246 sind kompatibel mit verschiedenen Druckermodellen von Brother, wie zum Beispiel:
HL-3140CW, HL-3150CDW, HL-3170CDW
DCP-9015CDW, DCP-9017CDW, DCP-9020CDW
MFC-9130CW, MFC-9330CDW, MFC-9340CDW
MFC-9140CDN, MFC-9142CDN, MFC-9332CDW
Es gibt auch Quellen (nicht wirklich hilfreich), aber die Ergebnisse sind erstmal nicht falsch.
Dann bewerte die doch mal (0/5)
Ich fragte also weiter:
Welcher von denen hat Farbe und das beste Preis- Leistungsverhältnis?
Bing hat mich dabei leider falsch verstanden und hat die Frage auf die Patronen, nicht auf die Drucker bezogen.
Ich versuchte es also erneut:
Wir fragen spezifisch nach. Sagen die Prompt-Gurus ja auch, dass das hilft (4/5)
Ich meinte nicht die Patronen, sondern die Drucker, die Du vorhin rausgesucht hast: Welcher dieser Drucker kann Farbe und hat das beste Preis-Leistungsverhältnis? HL-3140CW, HL-3150CDW, HL-3170CDW DCP-9015CDW, DCP-9017CDW, DCP-9020CDW MFC-9130CW, MFC-9330CDW, MFC-9340CDW MFC-9140CDN, MFC-9142CDN, MFC-9332CDW Ich drucke ca. zweimal die Woche etwa 10 Seiten. WLAN ist mir wichtig, damit ich auch vom Telefon aus drucken kann.
Bing sucht nach: Brother Drucker Farbe WLAN Preisvergleich
Und kommt mit einer hilfreichen Einschätzung: Alle können WLAN und Farbe. Preis-Leistungs-Verhältnis sei abhängig von meinen Präferenzen (no shit Sherlock! Deswegen habe ich sie Dir geschildert). Hervorgehoben werden die jeweils besten Modelle nach:
Druckgeschwindigkeit
Papierzufuhr
Duplexdruck
Preis
Außerdem könne ich „Druckqualität, die Toner-Kosten(sic!), die Garantie und die Kundenbewertungen vergleichen".
Nochmal zurück zum Randaspekt aus der Ausgangsfrage: Verfügbarkeit (0/5)
Ich frage also noch mal nach der Verfügbarkeit (denn komischerweise hat Brother meinen Drucker vor einigen Jahren aus dem Vertrieb genommen):
Welche der genannten Drucker werden aktuell noch verkauft? DCP-9015CDW beispielsweise scheint nicht mehr verkauft zu werden.
Bing sucht nach: Brother Drucker Verfügbarkeit
Die Antwort stammt aus den Web-Suchergebnissen. Die Verfügbarkeit der Druckermodelle kann je nach Anbieter variieren. Laut der offiziellen Website von Brother werden die meisten Modelle noch verkauft, außer DCP-9015CDW und MFC-9130CW. Sie können die aktuellen Preise und Angebote der Drucker auf verschiedenen Online-Plattformen vergleichen, wie zum Beispiel idealo.de. Ich hoffe, das hilft Ihnen weiter.
Helfen würde mir eine Antwort auf meine Frage. Denn alle genannten Modelle sind nicht mehr wirklich verfügbar.
Und jetzt?
Jetzt wandern die Patronen ins Büro, dort steht noch ein kompatibles Modell. Und ich suche einen neuen Drucker. Hast Du Empfehlungen? Oder muss ich Bing (oder besser Google?) fragen?
Und bevor Du fragst: Ja, ich brauche einen Drucker. Aus drei Gründen:
Zum Scannen/digitalisieren von Papier
Zum Ausdrucken der Schöffenwahl-Bewerbung. Wird langsam Zeit. Bei uns gilt die Frist 21.04. mancherorts wäre ich schon zu spät dran.
Ich habe Kinder und wir haben ein neues Hobby: Ausmalbilder designen (die Kinder designen den Prompt. Ich übersetze nur. Sobald sie mitbekommen, dass das auch ein Chatsystem kann, reden sie gar nicht mehr mit mir. ;) )
bing.com/create:
a lucky panda bear riding a rocket to the moon, eating a slice of a pizza. Looking in camera. Wide shot. Coloring page
|
|
Oliver hat das Indexierungsablaufdatum für Euch getestet |
Es kann der Anwendungsfall auftreten, dass Du eine URL bis zu einem bestimmten Datum in Suchmaschinen auffindbar haben möchtest und anschließend nicht mehr. Google stellt dafür den Wert "unavailable_after: [date/time]" für das Robots Meta Tag sowie für das X-Robots-Tag zur Verfügung.
Das könnte zum Beispiel so aussehen:
Wann findet die Deindexierung statt?
Doch auch wenn sich sogar eine konkrete Uhrzeit bei diesem Ablaufdatum angeben lässt, solltest Du Dich nicht darauf verlassen, dass die Indexierung genau auf diese Sekunde wegfällt.
Dass die geplante Dexindexierung generell aber funktioniert, hat Oliver H.G. Mason für Dich getestet und seine Erkenntnisse hier zusammengeschrieben. Der Höllenhund, der verwegene, ist mit seiner Seite ohgm.co.uk dafür ganz schön ins Risiko gegangen und hat das Ablaufdatum direkt mal für seine komplette Domain per HTTP-Header auf den 1. Januar 1970 gesetzt.
Mit dem URL Inspection Tool der Google Search Console konnte er die Änderung im Header entsprechend sehen. Doch damit die Indexierung wirksam wurde, musste er warten, bis Google die jeweilige Seite erneut gecrawlt hatte.
Indexing allowed? Yes?
Die GSC gibt übrigens weiterhin an: "Indexing allowed? Yes". Das ist natürlich nicht ganz stimmig. Korrekt ist, dass weiterhin kein "noindex"-Tag gesetzt ist und die Indexierung bis zum gepflegten "unavailable after"-Datum erlaubt war. Ich stimme Oliver zu, dass dieser Grenzfall im passenden Abschnitt "What isn't tested" der Support-Seite zum URL Inspection Tool ergänzt werden könnte.
Deindexierungs-Direktive
Dass Google die URL nach Recrawl, sobald das Ablaufdatum verarbeitet werden konnte, aus dem Index genommen hat, spricht laut Oliver dafür, dass es sich nicht nur um eine Empfehlung an Google handelt, so wie wir das von Canonicals kennen, sondern um eine Direktive. Dafür spricht auch, dass die Sprungmarke in Googles Dokumentation "#directives" heißt:\
https://developers.google.com/search/docs/crawling-indexing/robots-meta-tag#directives
Vorsicht ist also geboten. Google nimmt Deine Angaben entsprechend ernst. Obwohl Bing häufig nachzieht, was die Behandlung von Robots Meta Tags betrifft, so wird "unavailable after" von Bing aktuell nicht unterstützt. Hier müsstest Du also tatsächlich mit dem "noindex"-Tag arbeiten, um Deine URL aus sämtlichen Suchmaschinen zu räumen.
|
|
Facettierte Navigation mit Stefan Vorwerk 🎨 |
Stefan Vorwerk hat in seinem Vortrag "(Technische) SEO E-Commerce Challenges" auf der SMX 2023 unter anderem über Filter-Facetten im E-Commerce gesprochen. In freier Wildbahn sieht man hier häufig zwei Extreme:
Alle Filter-URLs sind indexiert
Vorteile
- Rankings für gefilterte Kategorie-Seiten können erzielt werden
Nachteile
Großes URL-Inventar
Hoher Crawling-Aufwand
Höheres Risiko, dass sich Seiten kannibalisieren
Weniger gezielte interne Verlinkung
Link-Power wird an Filter-URLs ohne Nachfrage "verschwendet"
Weniger Kontrolle
Keine Filter-URLs sind indexiert
Vorteile
Diese Lösung minimiert das URL-Inventar für irrelevante Seiten
Linkkraft wird gezielter auf weniger Ziele aufgeteilt
Crawling-Effizienz wird gesteigert
Nachteile
- Keine Rankings für bestimmte Filter(-Kombinationen)
Die Lösung: Nur wichtige Filter-Varianten gezielt indexieren lassen
Die Lösung ist dabei eigentlich gar nicht so kompliziert. Überlege Dir strategisch, für welche Filter(-Kombinationen) es eine Nachfrage gibt und lasse nur wichtige URLs indexieren.
Vorteile
Rankings für Filter-Varianten können erzielt werden
Gezielte Steuerung der internen Verlinkung/ Link-Power möglich
Crawl-Aufwand erhöht sich, aber es werden nur wichtige URLs gecrawlt
Herausforderungen
Varianten brauchen eigenen Content (einzigartige Bilder, H1, Snippet und eventuell Text)
Die relevanten Filter müssen bekannt sein. Daher wird eine Themenrecherche benötigt (Aufwand)
Es werden genügend Produkte für die gefilterte Kategorie-Seite benötigt
Steuerung der Indexierung und Deindexierung von unwichtigen Filter-URLs.
Laut Stefan ergibt sich daraus folgendes Konzept:
Noch mehr praktische Tipps aus dem E-Commerce-SEO findest Du auch auf Stefans Homepage.
|
|
|
Fragen? Immer gerne fragen!
|
Wir sind für Dich da.
Schreib uns gern jederzeit
eine E-Mail an [email protected] oder
ruf uns einfach kurz an: +49 40 22868040
Bis bald,
Deine Wingmen
|
|
Anckelmannsplatz 1, 20537 Hamburg, Germany
|
|